Anthropic ha lanzado una versión mejorada del LLM para principiantes

Créditos de la imagen: antrópico

Anthropic, la startup de IA cofundada por exejecutivos de OpenAI, ha liberado Una versión actualizada de la plantilla de generación de texto más rápida y económica disponible a través de la API, Claude Instant.

El lanzamiento actualizado de Cloud Instant, Cloud Instant 1.2, incorpora las fortalezas del modelo insignia recientemente anunciado de Anthropic, Cloud 2, y muestra ganancias «significativas» en áreas como matemáticas, codificación, razonamiento y seguridad, según Anthropic. En las pruebas internas, Claude Instant 1.2 obtuvo un 58,7 % en el punto de referencia de codificación en comparación con Claude Instant 1.1, que obtuvo un 52,8 % y un 86,7 % en un conjunto de preguntas de matemáticas frente al 80,9 % de Claude Instant 1.1.

“Instant Cloud produce respuestas más largas y estructuradas y sigue mejor las pautas de formato”, escribió Anthropic en una publicación de blog. Instant 1.2 también muestra mejoras en la extracción de citas, capacidades multilingües y respuesta a preguntas.

Cloud Instant 1.2 tiene menos probabilidades de alucinar y es más resistente a los intentos de jailbreak, afirma Anthropic. En el contexto de los modelos de lenguaje grande como Claude, una «alucinación» es cuando un formulario genera texto incorrecto o sin sentido, mientras que un jailbreak es una técnica que utiliza indicaciones escritas inteligentemente para eludir las funciones de seguridad colocadas en los modelos de lenguaje grande por sus creadores.

Claude Instant 1.2 presenta una ventana de contexto del mismo tamaño que la de Claude 2: 100.000 iconos. La ventana de contexto indica qué texto considera el formulario antes de crear texto adicional, mientras que los tokens representan texto sin formato (por ejemplo, «genial» se dividiría en los tokens «fan», «tas» y «tic»). Claude Instant 1.2 y Claude 2 pueden analizar aproximadamente 75.000 palabras, aproximadamente la extensión de «El gran Gatsby».

READ  Cómo acceder a la aplicación web Pixel Buds en Chromebooks

En general, es menos probable que los modelos con grandes ventanas contextuales «olviden» el contenido de las conversaciones recientes.

Como se mencionó anteriormente, la ambición de Anthropic es crear un «algoritmo de autoaprendizaje de próxima generación para inteligencia artificial», como lo describe en una presentación para inversores. Un algoritmo como este podría usarse para crear asistentes virtuales que puedan responder correos electrónicos, investigar, crear arte, libros y más, y ya tenemos algunos de ellos con GPT-4 y otros modelos de lenguaje grandes.

Pero Cloud Instant no es este algoritmo. En cambio, su objetivo es competir con ofertas similares de nivel de entrada de OpenAI, así como con nuevas empresas como Cohere y AI21 Labs, que están desarrollando y produciendo sus propios sistemas de IA de generación de texto y, en algunos casos, de generación de imágenes.

Hasta la fecha, Anthropic, lanzado en 2021 y dirigido por el exvicepresidente de investigación de OpenAI, Dario Amodi, ha recaudado 1450 millones de dólares con una valoración de un solo dígito en miles de millones. Si bien eso puede parecer mucho, es mucho menos de lo que la compañía estima que necesitará (5 mil millones de dólares en los próximos dos años) para crear el chatbot previsto.

Anthropic afirma tener «miles» de clientes y socios actualmente, incluido Quora, que brindan acceso a Claude y Claude Instant a través de su aplicación Poe basada en suscripción basada en inteligencia artificial. Claude ejecuta la herramienta DuckAssist lanzada recientemente por DuckDuckGo, que responde directamente a las consultas de búsqueda directas de los usuarios, junto con ChatGPT de OpenAI. Y en Notion, Claude es parte de la formación técnica de Notion AI, un asistente de escritura de IA integrado con el espacio de trabajo de Notion.

READ  Se ha anunciado un nuevo juego de Total War, que se desarrolla en el antiguo Egipto.



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *