Google desvela Veo 2 e Imagen 3, dos potentes generadores de vídeo e imágenes, y Whisk, un remezclador de contenido

Alejo I
Unos días después de lanzar Gemini 2.0, Google ha actualizado su repertorio de herramientas de creación de contenido mediante IA con Veo 2, un potente generador de vídeo con el potencial para superar Sora; Imagen 3, un modelo de generación de imágenes estáticas con abundantes mejoras; y Whisk, una interesante herramienta capaz de remezclar imágenes existentes mediante IA para crear nuevas composiciones.

Veo 2: vídeos más largos, más nítidos y con efectos de física avanzados




Comenzando por Veo 2, el nuevo generador de vídeo desarrollado por Google Labs sorprende por su enorme evolución. A pesar de que Veo se lanzó hace menos de un año, su revisión es capaz de brindar cuatro veces la resolución de sora y seis veces la extensión de sus clips, aunque en la práctica (y por ahora) están limitados a 720p y menos de diez segundos en VideoFX.

Además de brindar una mayor resolución y poder crear cortos más largos, Veo 2 también incorpora mejoras muy importantes en la composición, la definición de las escenas con mucho movimiento y en los efectos de física, incluyendo propiedades de líquidos, reflejos y objetos en colisión, aunque lógicamente siguen persistiendo los problemas de coherencia propios de todo modelo de generación mediante IA.


Google no ha señalado cuándo o si Veo 2 estará disponible en España (VideoFX solo se ofrece en EEUU, Australia, Nueva Zelanda y Kenia), pero indica que sus planes pasan por integrarlo en YouTube Shorts. Mientras tanto, la compañía ya ha publicado una lista de espera.

Imagen 3: mayor refinamiento y manos con el número adecuado de dedos (casi siempre)

Imagen

Imagen

En cuanto a Imagen 3, la tercera revisión del generador de imágenes estáticas de Google Labs ofrece optimizaciones notables en materia de estilo, composición y detalle. Las ilustraciones creadas usando Imagen 3 son más brillantes y vívidas, acercándose paso a paso al fotorrealismo.

Imagen 3, en cualquier caso, busca crear imágenes más verosímiles, que no necesariamente próximas a la realidad. Google Labs también ha perfeccionado la creación en estilos como el anime y el impresionismo, todo ello al tiempo que se reduce la aparición de artefactos, desde manchas a manos de seis dedos.

Imagen 3 se integra en ImageFX y está disponible globalmente.

Whisk: generador de ilustraciones por IA a partir de otras imágenes


Finalmente, Whisk es una nueva herramienta que permite generar imágenes a partir de imágenes ya existentes, sin necesidad de introducir instrucciones mediante texto. Pensando en esos usuarios que no saben ni cómo utilizar un prompt, Whisk permite seleccionar un sujeto a partir de una imagen o descripción, un escenario seleccionado usando esas mismas posibilidades y un estilo crear nuevas composiciones.

Whisk utiliza como base el generador de imágenes Imagen 3 y es por ahora una herramienta experimental solo accesible mediante una lista de espera que no da cabida a España.
Fuente: Google
Sobre el autor » Alejo I

Dos décadas escribiendo sobre nuevas tecnologías y cultura popular. Si tiene luces o botones, posiblemente he hablado de ello. EOLiano Gran Reserva.

Más publicaciones de Alejo I »

Avatar de Alejo I