OpenAI presenta Voice Engine, un modelo de IA para clonar la voz

Benzo
0 0 75
Noticias » Tecnología
Después de la generación de texto, imágenes y videos con modelos de IA, OpenAI presenta Voice Engine, un modelo para crear voces sintéticas a partir de una muestra de 15 segundos. Debido a los riesgos éticos y al posible mal uso de la clonación de la voz, Voice Engine no está disponible públicamente y por ahora la compañía solo lo ha puesto en manos de equipos de confianza para realizar una prueba a pequeña escala. Se trata del mismo enfoque que OpenAI adoptó con Sora, su modelo de IA de texto a vídeo revelado hace apenas unas semanas.

OpenAI explica que Voice Engine lleva en desarrollo desde 2022, momento a partir del cual se empezó a usar para potenciar las voces disponibles en la API de texto a voz así como ChatGPT Voice, una herramienta para interactuar con el chatbot con la voz, y Read Aloud, una función que lee en voz alta. Para generar una voz con un “sonido natural” que se “parece mucho” a la fuente original, Voice Engine necesita 15 segundos de voz grabada. Cuando tiene el material, el modelo de IA puede emplear esa voz para pronunciar cualquier texto.

Las primeras aplicaciones de Voice Engine incluyen usarlo para ofrecer asistencia en la lectura y la combinación con GPT-4 para crear respuestas personalizadas en tiempo real; traducción de contenido con la opción de conservar el acento nativo de la voz original; aplicaciones terapéuticas para personas con enfermedades que afectan el habla; o ayuda para recuperar la voz a pacientes con dificultades del habla. En la página de OpenAI encontraréis diferentes ejemplos donde se escucha la voz original y el audio generado con Voice Engine.

Nos encontramos ante una tecnología con enormes implicaciones para aquellos que se ganan la vida con la voz, incluyendo los narradores de audiolibros, actores de doblaje, servicio de atención al cliente, presentadores de radio, podcasteros… Por no hablar del uso que se puede hacer de la voz sintética para suplantar la identidad. OpenAI reconoce que la capacidad que tiene Voice Engine para pronunciar discursos con una voz que se asemeje a la de una persona “conlleva serios riesgos” que son “especialmente importantes en un año electoral [en Estados Unidos]”.

Para abordar estos peligros, OpenAI tiene una política de uso que prohíbe la suplantación de otra persona sin su consentimiento y el permiso explícito e informado de la persona que pone la voz original. Los usuarios de Voice Engine también están obligados a revelar al oyente que está escuchando una voz generada por IA. Además, OpenAI ha implantado un conjunto de medidas de seguridad que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un sistema de monitorización proactivo para saber cómo se utiliza.
75 comentarios
  1. Mejor escogida esa imagen, imposible!
  2. (imagen)
  3. Están que no paran, esto es increíble a la vez que peligroso, el mundo no volverá a ser seguro si se puede suplantar a uno con tanta facilidad.
  4. Lo único bueno de esta página es la selección de la imagen en casa noticia.

    Ojito con las estafas robando la voz.
  5. Y creo que leí una vez que la voz no tiene copyright.
    Así que se puede usar la voz de alguien sin consecuencias punibles que no sean un delito claro.
  6. Estamos jodidos. Contratos telefónicos diciendo nuestros datos (disponibles en mil sitios) dando aceptación...
  7. exitfor escribió:Estamos jodidos. Contratos telefónicos diciendo nuestros datos (disponibles en mil sitios) dando aceptación...


    Pues tienes toda la razón, cada vez hay más timos de este tipo en los que sin hacer nada te suplantan y la IA no deja de dar herramientas para crear "fakes" a punta pala.
  8. como las telefonicas etc etc graban nuestras voces cada vez que llamamos por averias etc..ya pueden clonar nuestras voces y tener audios perfectos donde digan que aceptamos nuevos contratos......o pueden haber audios donde digamos que reconocemos haber matado a nuestro vecino..etc

    y lo mejor..si ahora hay algun audio de un pllitico reconociendo que ha robado millones...siempre podra decir que es una voz que no es suya...

    es genial!!
  9. Al final la IA va a terminar como ls criptos, mayormente para uso delictivo [fiu]
  10. La tecnología evoluciona a una velocidad increíble, pero a su vez nosotros como sociedad no estamos evolucionando a la misma velocidad, con lo cual estas tecnologías en nuestras manos solo nos llevarán al más absoluto caos. Una pena.
Ver más comentarios »