El nuevo capítulo en la carrera armamentista de la IA generativa consiste en dotar a los modelos con la capacidad de mantener conversaciones fluidas. El objetivo es que se conviertan en un asistente personal con el que poder hablar de forma natural y de un modo intuitivo, una capacidad que no tienen los vetustos asistentes que programan alarmas y controlan dispositivos con simples comandos de voz. En este campo Open AI lleva la delantera con
GPT-4o, pero ahora Google se ha puesto al día con Gemini Live. Además, la compañía ha anunciado más extensiones de apps para ampliar las funciones de la IA en los dispositivos móviles.
Con Gemini Live, la IA de Google promete ofrecer "una experiencia conversacional móvil que te permite mantener conversaciones fluidas con tu asistente". La mecánica es simple, el usuario le pregunta a Gemini y este responde de forma natural. La réplica se puede interrumpir para insistir en algún punto en concreto o dejarla en pausa para reanudarla en otro momento. Google lo compara con "tener en el bolsillo un amigo con el que puedes charlar sobre nuevas ideas o practicar una conversación importante". Además, funciona en manos libres, en segundo plano o con el teléfono bloqueado, igual que una llamada telefónica normal.
Gemini Live se encuentra disponible desde hoy en inglés para los suscriptores de Gemini Advanced. En las próximas semanas se iniciará el despliegue en iOS y en otros idiomas.
Google también ha actualizado Gemini para mejorar la conexión con aplicaciones, cuya información se combina con la de la web y las herramientas de la compañía que emplea el usuario para ofrecer respuestas. En este sentido, el asistente sumará próximamente nuevas extensiones para Keep, Tareas y Utilidades. También ampliará las funciones en YouTube Music. Ejemplo de uso: hacer que Gamini busque una receta que nos enviaron por correo y pedir que añada los ingredientes necesarios a la lista de compras en Keep.
Próximamente también estará disponible la expansión Calendario, que por ejemplo permitirá fotografiar el folleto de un evento y preguntarle a Gemini si el día en el que se celebra está libre, o mostrarle el cartel de un concierto, preguntarle si esa noche hay un compromiso y programar un recordatorio para comprar las entradas.
"Ahora, la IA generativa nos puede ofrecer un tipo de ayuda totalmente nueva para tareas complejas y, en vez de minutos, puede ahorrarnos horas", dice Sissie Hsiao de Google. "Con Gemini, estamos reinventando lo que se entiende por un asistente personal útil de verdad. Gemini no deja de evolucionar, para aportar una forma de ayuda móvil alimentada por IA que abre una nueva dimensión. Y de un modo más natural, conversacional e intuitivo".