Microsoft consigue imitar la voz de cualquier persona mediante IA

Los avances en IA conversacional y de generación de imágenes están siendo tan espectaculares como continuados. En cuestión de unos pocos meses se han abierto al público varias plataformas capaces de proporcionar resultados virtualmente indistinguibles de los creados por un ser humano de carne y hueso salvo en los más nimios detalles, y tras la sorpresa que ha supuesto ChatGPT, ahora Microsoft ha anunciado VALL-E, una IA capaz de simular la voz de una persona con una muestra de solo tres segundos.

Este "modelo neuronal de códec de lenguaje" destaca por una elevadísima capacidad de síntesis del habla, posible gracias a una biblioteca de audio creada inicialmente por Meta que contiene 60.000 horas de inglés hablado por más de 7.000 interlocutores. Como suele suceder con muchos de estos registros para investigación y desarrollo (desde rostros para reconocimiento fácil a composiciones artísticas para generación de imágenes), gran parte de las muestras de audio proceden del dominio público, y más concretamente de los audiolibros de LibriVox.

Partiendo de esta vasta colección de sonidos humanos, VALL-E puede imitar una voz a partir de un corte de tres segundos y una ground truth a partir de una grabación de esa misma persona diciendo una frase concreta para ejecutar posteriormente una comparación. Con estos datos, la IA puede pronunciar los textos introducidos con sorprendente fidelidad. Según indica ArsTechnica, algunas frases pueden sonar algo enlatadas, pero otras pueden confundirse fácilmente con el habla de una persona real, manteniendo un tono emocional verosímil.

Microsoft tiene grandes expectativas para VALL-E. Algunos de sus posibles usos pasarían por la creación de aplicaciones de texto a voz de alta calidad, algo que podría ser muy útil para personas afectadas de dolencias en las partes del cuerpo que hacen posible el habla a nivel mecánico, así como para aquellas con problemas neurodegenerativos. Sin embargo, también existe un riesgo importante de que se produzca un uso fraudulento de VALL-E, y por este motivo Microsoft no ha querido divulgar el código. Lo que sí ha publicado es un paper que puede ser leído en este enlace.

Microsoft desvela VALL-E, una IA capaz de recrear la voz de cualquier persona a partir de un corte de tres segundos

Nuevas reservas abiertas en

Noticias relacionadas

OpenAI presenta Voice Engine, un modelo de IA para clonar la voz 75 29 mar 2024

Microsoft anuncia Windows Copilot, un asistente personal para Windows 11, y añade funciones de IA al terminal 33 23 may 2023

Microsoft estaría trabajando con AMD en el diseño de chips para inteligencia artificial 33 5 may 2023

Microsoft integrará ChatGPT en Edge y Bing para proporcionar respuestas conversacionales mediante IA 59 7 feb 2023

Microsoft anuncia el despido de 10.000 empleados 114 18 ene 2023

Nvidia lanza Canvas, una aplicación que convierte garabatos en paisajes artísticos mediante inteligencia artificial 31 24 jun 2021

El gigante chino Baidu quiere una filial dedicada a diseñar chips de inteligencia artificial 8 11 feb 2021

Apple compra la barcelonesa Vilynx para convertirla en uno de sus principales laboratorios de inteligencia artificial 40 28 oct 2020

Lo más visto de la semana

The Elder Scrolls IV: Oblivion Remastered ya disponible para Xbox Series, PS5, PC y Game Pass

Mario Kart World su jugabilidad, mecánicas y modos en un Direct de 15 minutos

Sony despieza una PS5 Pro para ofrecer un vistazo al interior y explicar su diseño

Nintendo Switch 2 mantiene su precio en Estados Unidos y las reservas se abrirán la próxima semana

The Elder Scrolls IV: Oblivion Remastered es real y se presentará mañana

Presentado Star Wars Zero Company, un juego táctico por turnos ambientado en las Guerras Clon

Lords of the Fallen lanza la versión 2.0 con progresión cooperativa, un pase de amigos y mejoras en el combate

Indiana Jones y el Gran Círculo llega a PS5 para ofrecer un juego cinemático de acción y aventura

Tráiler con gameplay de Light of Motiram, un juego free-to-play inspirado en Horizon

Doom: The Dark Ages nos muestra su guerra medieval contra el Infierno con un nuevo tráiler