Cualquier compañía que quiera ser relevante o sobrevivir en la era de la inteligencia artificial (IA) necesita tener el mejor modelo de IA posible. En Google, que llevan cerca de una década apostando por la IA, esto lo saben muy bien y hoy han dado un paso muy importante con la presentación de
Gemini, su modelo “más capaz y general hasta el momento”. El gran objetivo de Gemini es derrotar a GPT-4, el modelo de IA de OpenAI por el que ha apostado Microsoft, sin perder de vista a
Anthropic, la apuesta de Amazon.
“Nuestra primera versión, Gemini 1.0, está optimizada para diferentes tamaños: Ultra, Pro y Nano”, dice Sundar Pichai, director ejecutivo de Google y Alphabet. “Estos son los primeros modelos de la era Gemini y la primera realización de la visión que tuvimos cuando formamos Google DeepMind a principios de este año”. “Gemini es el resultado de esfuerzos de colaboración a gran escala por parte de equipos de Google [...]”, añade Demis Hassabis, director ejecutivo y cofundador de Google DeepMind. “Fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar diferentes tipos de información, incluidos texto, imágenes, audio, video y código”.
Gemini se presenta como algo más que un modelo de IA. Una de sus grandes virtudes es la flexibilidad a la que hace referencia Sundar Pichai cuando habla sobre los diferentes tamaños. Gemini es capaz de ejecutarse desde en centros de datos hasta en dispositivos móviles, y según Google sus capacidades “mejorarán significativamente” la forma en que los desarrolladores y clientes empresariales construyen y escalan con IA. La primera versión del modelo de IA Gemini cuenta tres tamaños cuyas funciones son las siguientes:
- Gemini Nano: se presenta como modelo más eficiente para ejecutarse de forma nativa en el dispositivo, por ejemplo un móvil Android. Pixel 8 Pro lo usará.
- Gemini Pro: un modelo para escalar en una amplia gama de tareas. También es el pilar de Bard, la herramienta de inteligencia artificial y bot conversacional de Google que desde hoy usa este modelo de IA.
- Gemini Ultra: es el modelo más grande y con mayor capacidad para tareas altamente complejas. Está diseñado para centros de datos y aplicaciones empresariales.
Gemini llegará a “miles de millones de personas” a través de los productos y servivios de Google. Por ejemplo, con Gemini Pro Bard podrá “comprender y resumir, razonar, generar ideas, escribir y planificar mucho mejor”, mientras que Gemini Nano estará
disponible en el móvil Pixel 8 Pro. En los próximos meses Gemini llegará a más productos y servicios de Google, incluyendo Chrome, los anuncios y Duet AI. Además, la compañía ya está experimentando con el buscador Google mediante la
SGE (Search Generative Experience).
Por otro lado, los desarrolladores y clientes corporativos podrán acceder a Gemini a partir del 13 de diciembre mediante la Gemini API en Google AI Studio o a través de Google Cloud Vertex AI.
Fuente: Google