Cada día aparecen más IA para diversos usos, pero nos alegra decir que ahora hay una para el mundo científico. La IA se llama Galactica y es perfecta para organizar materiales de lectura académica. Lo mejor de esto es que el programa está entrenando con millones de piezas de contenido académico. Y está diseñado para ayudar a la comunidad investigadora a gestionar mejor la información que hay por doquier.

Como dato curioso, debes saber que Galactica fue desarrollado por Meta AI en colaboración con Papers with Code. Nació porque el equipo identificó la sobrecarga de información como un obstáculo importante para el progreso científico. Esto señaló el equipo al respecto: “Los investigadores están enterrados bajo una masa de papeles, cada vez más incapaces de distinguir entre lo significativo y lo intrascendente”.

Por tal motivo, Galactica está diseñado para ayudar a clasificar la información científica. Y ha sido entrenado con 48 millones de artículos, libros de texto y notas de conferencias, millones de compuestos y proteínas, sitios web científicos, enciclopedias y más del conjunto de datos «NatureBook».

¿Qué trae de sorprendente esta IA que puede ayudar a gestionar la lectura académica?

Galactica ejemplo
Vía Decoder

A continuación, verás las claves que vuelven a la IA Galactica, una herramienta perfecta para gestionar la lectura académica:

  • Es capaz de almacenar, combinar y razonar sobre contenido científico. Si tomamos puntos de referencia como el MMLU matemático, esta IA supera con creces a los modelos de lenguaje como Chinchilla (41,3 % a 35,7 %) o PaLM 540B (20,4 % a 8,8 %).
  • A la hora de pensar en escenarios de aplicación específicos, el equipo de Galactica dice que podría usarse en la creación de revisiones de literatura, artículos wiki o notas de conferencias sobre temas científicos o en la respuesta a preguntas científicas.
  • El modelo también ofrece una búsqueda de artículos, donde un usuario puede describir el contenido de un artículo y recibir uno que coincida. Se pueden buscar fórmulas matemáticas específicas o describirlas en lenguaje natural o sugerir citas.

Sus creadores creen que Galactica podría mejorar mucho más

Vía Galactica

“Creemos que estos resultados demuestran el potencial de los modelos de lenguaje como una nueva interfaz para la ciencia”, escriben los investigadores.

En su artículo, el equipo señala con entusiamo numerosas oportunidades de mejora, incluido el uso de más fuentes académicas disponibles no públicas y capacitación multimodal con datos fuera del texto, tales como modelos de proteínas.

El equipo entrenó cinco modelos Galactica entre 125 millones y 120 mil millones de parámetros. Por lo tanto, el equipo asegura que el rendimiento de Galactica podría aumentar sin problemas con la escala. Todos los modelos son de código abierto y están disponibles gratuitamente en Github.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *