La apuesta de Meta por los modelos de lenguaje a gran escala se distingue por ser de código abierto, lo que facilita ganar el título de más grande y mejor en su sector. Sin embargo, la compañía liderada por Mark Zuckerberg no quiere quedarse ahí, así que ha
presentado Llama 3.1, la nueva generación de su modelo de IA que "rivaliza con los mejores modelos de código cerrado". Meta se refiere a
GPT-4o de OpenAI y
Claude 3.5 Sonnet de Anthropic, que están apoyados por Microsoft y Amazon, respectivamente.
"Llama 3.1 405B es el primer modelo de código abierto que compite con los principales modelos de IA en lo que respecta a las funciones más avanzadas de conocimientos generales, capacidad de conducción, matemáticas, uso de herramientas y traducción multilingüe", dice Meta. Esta nueva versión del modelo también permite que el asistente Meta AI basado en Llama esté disponible en nuevos países e idiomas, incluyendo México y varios territorios de América del Sur como Argentina, Perú y Chile.
La expansión de Meta AI permitirá a los usuarios usar este modelo (ahí donde esté disponible) en español a través de Facebook, Instagram, Messenger, WhatsApp y en la web meta.ai. Meta anunció hace pocos días que
no tiene la intención de lanzar sus modelos de IA más avanzados en Europa debido al "impredecible entorno regulatorio".
Las pruebas de Meta dicen que Llama 3.1 supera a GPT-4, GPT-4o y Claude 3.5 Sonnet en algunas tareas. Llama 3.1 es un modelo notablemente más complejo que los Llama 3 vistos hasta ahora. Su versión más grande tiene 405.000 millones de parámetros o elementos modificables y ha sido entrenado con más de 16.000 GPU H100 de Nvidia, lo que según Meta convierte a este modelo en el primero entrenado a esta escala. Los modelos más pequeños de Llama 3.1 suman 8.000 y 70.000 millones de parámetros. Los tres son multilingües, tienen una longitud de contexto de 128K y su ecosistema está configurado y listo para funcionar en los servicios de Amazon Web Services, Microsoft Azure, Google Cloud entre otros socios.
Meta confía que al ser de código abierto Llama seduzca a los desarrolladores que lo quieran integrar en sus productos. Llama es un modelo que se puede descargar, personalizar en función de las necesidades y aplicaciones, entrenar con nuevos conjuntos de datos y realizar ajustes adicionales. "Los desarrolladores pueden personalizar completamente sus aplicaciones y ejecutarlas en cualquier entorno, ya sea en las instalaciones, en la nube o incluso localmente en un portátil, todo ello sin compartir datos con Meta", dice la compañía. Además, Meta sostiene que Llama ofrece uno de los costes por
token más bajos del sector.