Microsoft desvela VALL-E, una IA capaz de recrear la voz de cualquier persona a partir de un cort... en Noticias

Alejo I 10 ene 2023 15:13 *

Ordo malleus

Staff

29.189 mensajes
desde sep 2000

Editado 2 veces. Última: 10/01/2023 - 22:34:43 por .

Los avances en IA conversacional y de generación de imágenes están siendo tan espectaculares como continuados. En cuestión de unos pocos meses se han abierto al público varias plataformas capaces de proporcionar resultados virtualmente indistinguibles de los creados por un ser humano de carne y hueso salvo en los más nimios detalles, y tras la sorpresa que ha supuesto ChatGPT, ahora Microsoft ha anunciado VALL-E, una IA capaz de simular la voz de una persona con una muestra de solo tres segundos.

Este "modelo neuronal de códec de lenguaje" destaca por una elevadísima capacidad de síntesis del habla, posible gracias a una biblioteca de audio creada inicialmente por Meta que contiene 60.000 horas de inglés hablado por más de 7.000 interlocutores. Como suele suceder con muchos de estos registros para investigación y desarrollo (desde rostros para reconocimiento fácil a composiciones artísticas para generación de imágenes), gran parte de las muestras de audio proceden del dominio público, y más concretamente de los audiolibros de LibriVox.

Partiendo de esta vasta colección de sonidos humanos, VALL-E puede imitar una voz a partir de un corte de tres segundos y una ground truth a partir de una grabación de esa misma persona diciendo una frase concreta para ejecutar posteriormente una comparación. Con estos datos, la IA puede pronunciar los textos introducidos con sorprendente fidelidad. Según indica ArsTechnica, algunas frases pueden sonar algo enlatadas, pero otras pueden confundirse fácilmente con el habla de una persona real, manteniendo un tono emocional verosímil.

Microsoft tiene grandes expectativas para VALL-E. Algunos de sus posibles usos pasarían por la creación de aplicaciones de texto a voz de alta calidad, algo que podría ser muy útil para personas afectadas de dolencias en las partes del cuerpo que hacen posible el habla a nivel mecánico, así como para aquellas con problemas neurodegenerativos. Sin embargo, también existe un riesgo importante de que se produzca un uso fraudulento de VALL-E, y por este motivo Microsoft no ha querido divulgar el código. Lo que sí ha publicado es un paper que puede ser leído en este enlace.

Fuente: ArsTechnica

Carlitosguay 10 ene 2023 15:13

MegaAdicto!!!

4.212 mensajes
desde mar 2013

Vale

danyelastra 10 ene 2023 15:19

MegaAdicto!!!

823 mensajes
desde dic 2010

1 valoración positiva

Carlos Latre al paro.

NaN 10 ene 2023 15:20

SaruNaN

25.222 mensajes
desde sep 2002
en Taipei(TW)-Eindhoven(NL)

Steam ID: nan_eol

5 valoraciones positivas

Expectativas:

Microsoft tiene grandes expectativas para VALL-E

La realidad:

La gente usara la IA para que diga frases guarras con voz de famosas mientras se estrujan la nutria

DiGiL 10 ene 2023 15:26

Retired

4.339 mensajes
desde ago 2005
en Yharnam

Si fuera actor de doblaje estaria ahora mismo bajandome los testiculos a su lugar correspondiente.

largeroliker 10 ene 2023 15:26

MegaEcléctico!!!

23.545 mensajes
desde dic 2008
en Málaga

Gamertag: larger0o PSN ID: larger0o Steam ID: larger0o

La verdad es que esto tiene mucho, mucho peligro. La dinamita del siglo XXI [+risas]

INCUBUS 10 ene 2023 15:26

Videoludonista™

14.630 mensajes
desde may 2002
en el Infierno

Interesante para hacer perrerías.

SouYi 10 ene 2023 15:30

Adicto

151 mensajes
desde jul 2008

Osea que con esto, el día de mañana, puedo presentar una “grabación” de teléfono falsa e incriminar a alguien por ello.

También podría suplantar a alguien para el robo de datos, haciéndome pasar por esa persona.

Armas de doble filo todo esto.

stan01 10 ene 2023 15:31

Rush Feudal

2.499 mensajes
desde ene 2007
en Galicia

Lo que ha avanzado todo esto en los últimos 3 años es una locura, en 5 años estoy seguro de que vamos a flipar mucho, se viene un cambio como lo fue en su dia internet

GXY 10 ene 2023 15:31

El Otro Usuario

87.750 mensajes
desde nov 2001
en Un Mundo Liberal

pues muy bien.

ya podemos mandar a la mierda toda la biometria basada en voz humana, media industria del doblaje, y otra media docena de cosas mas.

la IA no da mas que alegrias.

HauryasuMifune 10 ene 2023 15:31

MegaAdicto!!!

2.061 mensajes
desde abr 2019
en Madrid - Suroeste

Le veo más posibilidad de uso para fines chungos o delictivos que otra cosa. Suplantaciones de identidad a la orden del día…

harryhaller 10 ene 2023 15:32

MegaAdicto!!!

3.607 mensajes
desde ago 2011

4 valoraciones positivas

harryhaller está baneado por "Troll"

danyelastra escribió:Carlos Latre al paro.

Si es así, este proyecto habrá merecido cada céntimo que hayan invertido en él.

blackorwhite 10 ene 2023 15:38 *

Prolegómeno

2.909 mensajes
desde jun 2005
en la mitología nórdica.

Página web de blackorwhite

Editado 4 veces. Última: 10/01/2023 - 15:41:00 por blackorwhite.

Y donde quedará mi imitación de boris izaguirre??
Al final no hará falta ni que hablemos. Ya hablarán por nosotros. Ni hará falta que opinemos, ya opinarán por… o wait

Billie_Joe 10 ene 2023 15:39

MegaAdicto!!!

1.286 mensajes
desde dic 2002

1 valoración positiva

Como muchos comentan, este WALL-E combinado con otra IA de video deepfake debería acelerar la modificación de algunas legislaciones para adaptarlas al ̶f̶u̶t̶u̶r̶o̶ presente.

harryhaller escribió:
danyelastra escribió:Carlos Latre al paro.

Si es así, este proyecto habrá merecido cada céntimo que hayan invertido en él.

ecoter2 10 ene 2023 15:39

MegaAdicto!!!

1.210 mensajes
desde jul 2013
en mi casa y mi trabajo

Al final los dobladores al paro, los dibujantes al paro, los programadores al paro ... y a vivir la vida

uukrul 10 ene 2023 15:40

MegaAdicto!!!

3.115 mensajes
desde abr 2008

Doblaje en tiempo real para cualquier idioma en cualquier servicio de streaming.

El doblaje como lo conocemos está acabado.

LLioncurt 10 ene 2023 15:45

Nobato

27.755 mensajes
desde ene 2005
en Madriz

NaN escribió:Expectativas:
Microsoft tiene grandes expectativas para VALL-E

La realidad:
La gente usara la IA para que diga frases guarras con voz de famosas mientras se estrujan la nutria

Quien dice famosas dice compañeras de trabajo.

sadus 10 ene 2023 15:45

MegaAdicto!!!

1.233 mensajes
desde feb 2007
en girona

Con esto tenemos el Sálvame hasta el dia del juicio final.

stan01 10 ene 2023 15:45

Rush Feudal

2.499 mensajes
desde ene 2007
en Galicia

Al final simplemente por inputs ya sean escritos desde una consola o por comandos de voz se va a poder generar hasta tu propia pelicula desde casa de imagen "real" generada por IA, con los actores que tu quieras replicando hasta su voz, la realidad superando a la ficción por enésima vez

Ñomo 10 ene 2023 15:48 *

MegaAdicto!!!

6.637 mensajes
desde feb 2016

Página web de Ñomo

Editado 1 vez. Última: 10/01/2023 - 15:48:23 por Ñomo.

...venga vaaale, ya lo digo yo:

"Todo ésto, suponiendo que funcione tan bien como lo venden."

...que me da a mí que no.

neofonta 10 ene 2023 15:48

MegaAdicto!!!

13.810 mensajes
desde feb 2008
en rubinense

Gamertag: F0NTA PSN ID: FONTA_Steam ID: neofonta

Predigo que el oficio de actor de doblaje va a ir a menos.

Me consuela saber que podremos oír de nuevo la voz del difunto Constantino Romero [tadoramo]

GXY 10 ene 2023 15:50

El Otro Usuario

87.750 mensajes
desde nov 2001
en Un Mundo Liberal

HauryasuMifune escribió:Le veo más posibilidad de uso para fines chungos o delictivos que otra cosa. Suplantaciones de identidad a la orden del día…

hay que decir que los sistemas de atencion a personas por voz no suelen "fiarse de la voz de la persona" para autentificarla.

suelen pedir algun otro tipo de clave de usuario, que suelen ser claves numericas o alfanumericas (pin, clave de firma, etc).

la identificacion biometrica por voz no es habitual (por poco fiable, principalmente) pero a esa si la veo mucho mas afectable.

pero sobre todo donde si podria haber un peligro de suplantacion es en comunicacion de persona a persona. por ejemplo si a una persona le roban documentacion y/o el movil y se comunica con contactos de la agenda, se puede hacer pasar por esa persona (especialmente si el movil no tiene bloqueos de seguridad).

sadus 10 ene 2023 15:50

MegaAdicto!!!

1.233 mensajes
desde feb 2007
en girona

@neofonta

O la de chiquito :_)

mogurito 10 ene 2023 15:51

Soy un Cimmerio

24.997 mensajes
desde dic 2000
en La montaña del Dios Crom

Por favor, que hagan la voz de Torrente.

Señor M 10 ene 2023 15:59

MegaAdicto!!!

4.562 mensajes
desde abr 2013

Gamertag: DvRodal PSN ID: DvRodal Steam ID: DvRodal

Y porque siguen inventando cosas que solo.sirven para el mal?

emiliojrc 10 ene 2023 16:04

MegaAdicto!!!

4.824 mensajes
desde mar 2008
en sevilla

Gamertag: emiliojrc PSN ID: emiliojrc

Me pilló una para ponersela a mi mujer en bucle!!!!! [fiu]

Fleishmann 10 ene 2023 16:05

MegaAdicto!!!

4.369 mensajes
desde oct 2012
en Lugo

Página web de Fleishmann Steam ID: fleishmann

Dentro de nada las películas las protagonizas tú y tus colegas.

Los actores también van al cucho. Habra solo modelos tipo el actor ese de gollum.

NaN 10 ene 2023 16:07

SaruNaN

25.222 mensajes
desde sep 2002
en Taipei(TW)-Eindhoven(NL)

Steam ID: nan_eol

LLioncurt escribió:
NaN escribió:Expectativas:
Microsoft tiene grandes expectativas para VALL-E

La realidad:
La gente usara la IA para que diga frases guarras con voz de famosas mientras se estrujan la nutria

Quien dice famosas dice compañeras de trabajo.

o compañeros

Lazebrazul 10 ene 2023 16:09

MegaAdicto!!!

7.810 mensajes
desde abr 2004
en En Sego

Estas cosas pensando en gente vulnerable como ancianos o niños me empiezan a dar miedo [mad]

manoo205 10 ene 2023 16:13

MegaAdicto!!!

766 mensajes
desde nov 2002

Lazebrazul escribió:Estas cosas pensando en gente vulnerable como ancianos o niños me empiezan a dar miedo

Vaya, el miedo es algo que nos ayuda mucho en la vida!!

OOQQ 10 ene 2023 16:18

Peligrosamente Real

1.594 mensajes
desde may 2017
en Summoner's Rift

Gamertag: /Profile?gamerTag=OOQQok PSN ID: OOQQok Steam ID: OOQQok

J.A.R.V.I.S alla vamos

ismacom 10 ene 2023 16:18

MegaAdicto!!!

812 mensajes
desde mar 2011
en Madrid Sur

Jazztel y Vodafone se están frotando las manos pensando en sus call centers.

DavET 10 ene 2023 16:20 *

0_-|oOo|-_0

2.972 mensajes
desde jul 2017
en RANCIO NATION aka Spain

Editado 1 vez. Última: 10/01/2023 - 16:20:28 por DavET.

DavET está baneado por "Saltarse el ban con un clon"

Pero qué clase de brujería es esta ???
Skynet, cuando lances el ataque avísame para correrme antes la farra final ... [beer]

Pararegistros 10 ene 2023 16:20 *

MegaAdicto!!!

15.174 mensajes
desde nov 2006
en Más allá de allí.

Editado 1 vez. Última: 10/01/2023 - 16:22:09 por Pararegistros.

¡Vaya, vaya! Se tira Jack Bauer toda la mitad de la T2 de 24 buscando a Alex Hewitt [...]

https://24.fandom.com/wiki/Alex_Hewitt

[...] y lo único que tenía que haber hecho es llamar a Satya Nadella. [qmparto]

Dicho lo cual, ahora sí que van a petarlo los vídeos de coña de LipSync.😁

Abrams 10 ene 2023 16:24

MegaAdicto!!!

7.076 mensajes
desde nov 2014
en Hoenn

Genial, cada vez se acerca más el día en que pueda hacerme mis propios audiolibros de ESDLA narrados por Pepe Mediavilla

fer5 10 ene 2023 16:29

-> Click aquí <-

3.176 mensajes
desde abr 2007
en Galicia

Estupendo para poner en boca de otros frases que nunca han dicho, subirlo a redes sociales y hacer que el mundo arda.

neofonta 10 ene 2023 16:33

MegaAdicto!!!

13.810 mensajes
desde feb 2008
en rubinense

Gamertag: F0NTA PSN ID: FONTA_Steam ID: neofonta

emiliojrc escribió:Me pilló una para ponersela a mi mujer en bucle!!!!!

Con la frase:

Sí cariño

SUGUSAPPLE 10 ene 2023 16:34

.ARJ

8.907 mensajes
desde ago 2007
en MONKEY ISLAND

Gamertag: Windows95 molaba PSN ID: Betamax puta Sony.Steam ID: En construcción.

neofonta escribió:Predigo que el oficio de actor de doblaje va a ir a menos.

Me consuela saber que podremos oír de nuevo la voz del difunto Constantino Romero

Siempre podrás,Luke... Analiza tus sentimientos. [+risas]

Vectorchile 10 ene 2023 16:34

MegaAdicto!!!

1.370 mensajes
desde jun 2002
en Santiago, Chile

PSN ID: vectorxchile

los estafadores se deben estar frotando las manos...

aka_psp 10 ene 2023 16:35

$120K

6.577 mensajes
desde ago 2006
en Terrassa

Steam ID: aka_kun

NaN escribió:Expectativas:
Microsoft tiene grandes expectativas para VALL-E

La realidad:
La gente usara la IA para que diga frases guarras con voz de famosas mientras se estrujan la nutria

Eso ya se ha hecho con 15.ai [hallow]

curro76 10 ene 2023 16:41

Habitual

29 mensajes
desde nov 2012

pasnake 10 ene 2023 16:42

MegaAdicto!!!

37.356 mensajes
desde nov 2007

fer5 escribió:Estupendo para poner en boca de otros frases que nunca han dicho, subirlo a redes sociales y hacer que el mundo arda.

#589938# 10 ene 2023 16:45

NaN escribió:Expectativas:
Microsoft tiene grandes expectativas para VALL-E

La realidad:
La gente usara la IA para que diga frases guarras con voz de famosas mientras se estrujan la nutria

A mi me gustaría hacer la voz de Bender o la de Peter Griffin para que dijesen burradas; con otros personajes la gente se daría cuenta de que se trata de un deepfake de audio si dices cosas muy burras, pero con Bender y Peter la gente se preguntaría si es un deepfake o si han sacado el audio de algún episodio.

jouse norris 10 ene 2023 16:45

MegaAdicto!!!

2.200 mensajes
desde dic 2010
en Madrid

Gamertag: Jouse Norris

La extrema derecha frotándose las manos

Crápula 10 ene 2023 16:48

In Venus veritas

2.205 mensajes
desde ene 2006

Lazebrazul escribió:Estas cosas pensando en gente vulnerable como ancianos o niños me empiezan a dar miedo

Es que nadie va a pensar en los niños?

Elm1ster 10 ene 2023 16:48

MegaAdicto!!!

16.895 mensajes
desde abr 2008

Y los juegos exclusivos?

NeORomani 10 ene 2023 16:50 *

MegaAdicto!!!

1.692 mensajes
desde jun 2008

Editado 1 vez. Última: 10/01/2023 - 16:50:21 por NeORomani.

Muy bien, pero siguen faltando robots que hagan la vendimia

Crápula 10 ene 2023 16:53

In Venus veritas

2.205 mensajes
desde ene 2006

Respecto del doblaje a muerto... Acaso la ia podrá expresar también los infinitos matices emocionales de la interpretación actoral? Que una cosa es que suene igual y otra que pueda comportarse igual.

davoker 10 ene 2023 17:01

(╯‵□′)╯︵┻━┻

23.853 mensajes
desde oct 2006
en Gijon (Asturias)

Página web de davoker Steam ID: Davoker

Vaya, stephen hawking estará removiéndose en su tumba pensando: "coño, podría haber hablado con mi voz y no como una versión cutre de Darth Vader" [+risas]

Veo aplicaciones para modding aquí, enseñarle a esa IA con voces en Español y ponerle voz en Español a juegos que no están doblados al idioma por ejemplo, o darle voz en ingles a los que solo tienen texto y no están doblados directamente, con el modding y una herramienta así es perfectamente posible, a mi me parece de lo mas interesante mas allá de las aplicaciones digamos médicas como lo que se menciona en la noticia