Google Chrome lanza en fase de pruebas un sistema de transcripción para convertir cualquier audio...

Hace algo menos de un año, Google lanzaba los teléfonos Pixel 4 y Pixel 4 XL, dos smartphones que estrenaban algunas características a modo experimental y como anticipo de su despliegue en otros dispositivos y aplicaciones. Entre ellas se encontraba la transcripción automática de archivos de audio, una tecnología que ahora ya puede encontrarse en la última versión Canary de Chrome.

Esta tecnología, conocida en inglés como Live Caption, permite generar subtítulos para cualquier archivos de vídeo o audio en tiempo real, mejorando así la interpretación de conversaciones en videoconferencias, la lectura de las letras de una canción o el visionado de archivos multimedia con el sonido desactivado (algo que hasta ahora solo era posible en YouTube y desde el sitio o la aplicación oficial, no en cualquier archivo y desde el navegador).

Vídeo de Live Caption publicado con motivo de la conferencia para desarrolladores I/O 2019.

La opción para activar la transcripción de archivos de audio se encuentra dentro de los parámetros de accesibilidad y viene oculta por defecto. Para poder utilizarla es necesario descargar una build Canary lo más reciente posible, abrir chrome://flags y activar #enable-accessibility-live-captions. Una vez hecho, es necesario reiniciar el navegador. Solo entonces aparecerá el interruptor que permite activar o desactivar las transcripciones.

Es necesario recordar que Chrome Canary es una versión para desarrolladores y por lo tanto puede ser inestable. Por ahora se desconoce cuándo se activará esta funcionalidad en el navegador estándar, que hace muy poco fue objeto de una importante actualización.

Otra duda, tal vez más importante, es qué hará Google con las transcripciones de audio, puesto que en un principio no se pueden ver avisos relacionados con la privacidad de las mismas; un asunto peliagudo y que ya ha traído problemas a la compañía por su captación y procesamiento a través de Google Assistant.

Fuente: XDA-Developers
Grande Google sacándose de la manga tecnologías que servirán a tod@s.
Como son las traducciones de google hoy en dia?
Azucar escribió:Como son las traducciones de google hoy en dia?

Bastante decentes.
Si hablo en castellano lo transcribirá en inglés?
kechua escribió:Si hablo en castellano lo transcribirá en inglés?

Entiendo que de momento únicamente transcribirá lo que dices al idioma que lo dices.

Pero si funciona bien supongo que añadirán la opción de traducirlo más pronto que tarde.
Esto lleva un tiempo metiéndoselo Microsoft al chat multijugador de los videojuegos de Xbox, es un puntazo.
XboxoX está baneado del subforo hasta el 10/12/2024 09:54 por "flames continuos en las noticias sobre Sony"
Lo que no entiendo es como no se aplica desde hace tiempo a los video juegos como añadido a las consolas.
Al menos tendriamos traducción al vuelo opcional en tantos y tantos juegos que no se localizan.
Hombre, si con esto me localizan al Inglés los vídeos que haga en Español[sin tener que hacer yo la traducción, que a veces me explayo y es un peñazo [+risas]] o se puede hablar con una persona por videoconferencia que hable otro idioma y el programa te se lo subtitula en su idioma...¡Que cuenten conmigo como Beta Tester! [+risas] Puede ser muy útil en según que casos...
Para las personas sordas es el futuro
En el Youtube no va muy fino. Un ser humano detecta e identifica mejor las palabras que esa IA. Pero seguramente en un futuro se hará de forma perfecta
Hace un tiempo estuve hablando con uno de los ingenieros de Microsoft que llevaban el tema de la traducción de voz en tiempo real con Skype Translator.

Estuvimos debatiendo sobre el porcentaje de fiabilidad, y vamos se llegó a la conclusión de que para que estos sistemas funcionen la persona tiene que ser mínimo nativa de Madrid o Valladolid :), en cuanto le hablabas en andaluz acortando las palabras el invento se iba a tomar viento.
traducir nosé como lo hará de bien pero el reconocedor de voces va muchísimo mejor que antes porque activé los subtitulos de una transmisión en directo de un sevillano de Dos Hermanas (con acentazo total) y los subtítulos lo transcribía casi todo perfectamente.

y en twitch los chats con voz activada el único problema es que la gente pasa de acentuar las palabras y entonces te las pronuncia como palabras llanas.
Flanders escribió:Hace un tiempo estuve hablando con uno de los ingenieros de Microsoft que llevaban el tema de la traducción de voz en tiempo real con Skype Translator.

Estuvimos debatiendo sobre el porcentaje de fiabilidad, y vamos se llegó a la conclusión de que para que estos sistemas funcionen la persona tiene que ser mínimo nativa de Madrid o Valladolid :), en cuanto le hablabas en andaluz acortando las palabras el invento se iba a tomar viento.


Soy andaluz, con acento bastante marcado y muy zezeante (para mi las ces y eses no existen [sonrisa] ) y de acortar muchas palabras, y el dictador este del gboard que va con el teclado cuando escribo en wasap la mayoría de las veces me pilla todas las palabras al vuelo sin problemas la verdad.

Supongo que aqui la complejidad sera el tiempo de procesado para hacerlo en tiempo real.
13 respuestas