La carrera armamentista de IA de Big Tech con un nuevo paradigma de lenguaje se está calentando

24 feb (Reuters) – Meta Platforms Inc (METAO) dijo el viernes que lanzará a los investigadores un nuevo modelo de lenguaje grande, el programa base para un nuevo sistema de inteligencia artificial, intensificando la carrera armamentista de IA a medida que las grandes empresas tecnológicas se apresuran a integrar la tecnología en sus productos y deslumbrar a los inversores.

La batalla pública por el control del espacio tecnológico de IA comenzó a fines del año pasado con el lanzamiento del software ChatGPT de OpenAI, respaldado por Microsoft, y provocó que los gigantes tecnológicos, desde Alphabet Inc (GOOGL.O) hasta Baidu (9888.HK) de China, promover sus propias ofertas. .

Meta LLaMA, abreviatura de Large Language Model Meta AI, estará disponible bajo una licencia no comercial para investigadores, entidades gubernamentales, la sociedad civil y la academia. Blog.

Los modelos de lenguaje grandes extraen cantidades masivas de texto para resumir información y crear contenido. Pueden responder preguntas, por ejemplo, con oraciones que se pueden leer como si estuvieran escritas por humanos.

Últimas actualizaciones

Ver 2 historias más

El modelo, que según Meta requería «significativamente menos» poder de cómputo que las demostraciones anteriores, fue entrenado en 20 idiomas con énfasis en aquellos con alfabetos latino y cirílico.

«El anuncio de Meta de hoy parece ser un paso en la prueba de sus capacidades generativas de inteligencia artificial para que puedan implementarlas en sus productos en el futuro», dijo Jill Luria, analista senior de software de DA Davidson.

“La IA generativa es una nueva aplicación de IA con la que Meta tiene menos experiencia, pero que es claramente importante para el futuro de su negocio”.

READ  Las acciones técnicas caen cuando Dow, S&P 500 caen en una sesión agitada

La inteligencia artificial se ha convertido en un punto brillante para las inversiones en la industria tecnológica, cuyo lento crecimiento ha provocado despidos generalizados y menores apuestas experimentales.

Meta dijo que LLaMA puede superar a los competidores al examinar más parámetros o variables que el algoritmo tiene en cuenta.

Específicamente, dijo que una versión de LLaMA con 13 mil millones de parámetros podría superar a GPT-3, un predecesor reciente del modelo en el que se basa ChatGPT.

Describió el modelo LLaMA de 65 mil millones de variables como «competitivo» con Chinchilla70B y PaLM-540B de Google, que son más grandes que el modelo que Google usó para mostrar la búsqueda impulsada por chat de Bard.

Una portavoz de Meta atribuyó el rendimiento a la mayor cantidad de datos «más limpios» y las «mejoras arquitectónicas» en el modelo que mejoraron la estabilidad del entrenamiento.

Meta lanzó en mayo del año pasado un modelo de lenguaje grande OPT-175B, también destinado a investigadores, que formó la base para una nueva iteración del chatbot BlenderBot.

Más tarde presentó un modelo llamado Galactica, que podía escribir artículos científicos y resolver problemas matemáticos, pero retiró rápidamente la demostración después de que generó respuestas falsas y aparentemente creíbles.

Información adicional de Yuvraj Malik y Eva Matthews en Bengaluru y Katie Paul en Nueva York; Editado por Shailesh Cooper y Grant McCall

Nuestros estándares: Principios de confianza de Thomson Reuters.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *