¿Por qué no se ha explorado antes la voz como controlador interactivo en juegos AAA sandbox?

Sabiendo que el lenguaje es lo que en parte ha permitido nuestro desarrollo como civilización y que es una de las formas en que podemos enviar millones de órdenes usando palabras o frases, al contrario de un mando que tiene un número limitado de botones ¿Cómo es que en los videojuegos eso no se ha explorado casi? Me refiero a que las empresas importantes que podrían haberlo implementado y convertirlo en un estándar nunca le han visto potencial, siempre ha sido algo muy experimental y escondido en los pocos juegos que lo permitían.

Hay algunos juegos que si fueron pioneros y que lo intentaron, pero son juegos muy poco conocidos y la feature ni siquiera se hacía notar, además que quedaron en nada, no marcaron un antes y un después en la industria, aunque fuesen los pioneros en implementar la tecnología, a veces falta la compañía que plante un juego que marque un antes y un después con algo relacionado con este tipo de interacción y que la convierta en un punto de no retorno.

Lifeline de PS2 demuestra lo que es posible de hacerse con un simple diccionario con palabras, y en una PS2.


Obviamente casi nadie quiere jugar a algo así, como algo experimental es interesante, pero un juego que sea completamente así entiendo que no es atractivo, esto debe mezclarse con la jugabilidad clásica del mando, es la curiosidad de que algo así ya era posible en PS2 y que han habido más juegos que lo han intentado, pero nunca ha sido una empresa muy importante y tampoco se ha vendido como algo revolucionario en cuanto a interacción.

Muchas veces quien pone una tecnología en la cúspide no es su creador, es el que sabe crear un producto que venda ese tipo de tecnología a la gente, que convenza a la gente de que eso es divertido y necesario, y eso no ha ocurrido aún con ningún juego.

Ahora que apareció GPT4 parece que se puede potenciar la narrativa de los NPCs y que puede que se empuje más, pero esto se podría haber hecho desde mucho antes con un simple transcriptor de audio a texto, se podrían haber creado sistemas muy complejos o más simples basados en la voz aumentando la interactividad en los juegos y pudiendo vender una tecnología como algo nuevo que iba a marcar una generación así como lo hicieron las coberturas en los TPS o la cámara al hombro.


Igual la generación de PS3 y 360 no era la mejor para estandarizarlo pero si para experimentar con algo así, pienso que en PS4 y ONE se podría haber empezado a ser más pioneros en este aspecto con una estandarización de la tecnología ya que el online ya estaba asentado y gran parte de los jugadores ya usaban micrófono para jugar a videojuegos, de hecho pienso que el micrófono debería de convertirse en un elemento interactivo indispensable de algunos videojuegos.


Hemos visto algunos juegos con esa feature medio escondida ya hace la tira de años, juegos con un impacto medio o flojo, que no tienen repercusión, y hemos visto experimentos con mods en skyrim que si han tenido bastante impacto ¿Pero por qué los estudios AAA no se mojan con esto? ¿Por qué no quieren ser pioneros?

En Red Dead Redemption 2 podrían haber hecho cosas espectaculares con el micrófono, desde stealth como llamar la atención de NPCs, llamar al caballo, insultar a los NPCs, espantar un animal a un cazador, ordenes simples como pedir munición, que un compañero dispare, me refiero a cosas muy simples que no hubieran requerido de GPT4, no me refiero a tener largas conversaciones con los NPC, solo un transcriptor de voz a texto para cuatro funciones interactivas experimentales que sean divertidas y que mejoren la experiencia del jugador.

O igual que se han creado elementos clichés en los videojuegos como atalayas para desbloquear el mapa y cosas de esas, con el micrófono por órdenes se podrían haber creado las típicas misiones de infiltración donde das órdenes a un NPC para que se infiltre en un sitio, le vas dando indicaciones con la voz para ir esquivando enemigos y cubriéndose "agacha", "adelante", "izquierda", "derecha", "ataca", se podrían haber hecho cosas muy chulas que se han dejado siempre en segundo lado en pro del apartado visual, que parece ser que es de lo poco que ha evolucionado en dos décadas, texturas y animaciones, y mucha cinemática.

A las puertas de 2025 y esto sigue en pañales, me da a mi que solo veremos mods con GPT4, y para hacer lo que he dicho no se necesita un servicio cloud, un trascriptor de voz a texto con un diccionario de palabras se podía ejecutar perfectamente en segundo plano y el impacto sería muy reducido.


Yo creo que si esto se hubiera hecho en GTA 4, RDR1 y GTA V vendiéndose como algo divertido hubiera sido algo revolucionario, muchos juegos de mundo abierto lo hubieran implementado luego, y en RDR2 el sistema hubiera sido mucho mejor adaptado al estilo de juego que es, y ya en GTA VI teniendo la tecnología que hay hoy en día podría ser revolucionario, el problema es que no se ha gestado un progreso y creo que si se hubiera partido de muchos años antes la evolución de la tecnología hubiera sido mucho mejor porque se tendría mejor conocimiento de en que lugares es mejor implementarla, en donde es imprescindible para mejorar la jugabilidad y el diseño de un juego, es como si nos hubiéramos estancado durante décadas y hubiera habido cero progreso de forma progresiva, es como que de repente ahora tenemos GPT4 y se pueden hacer cosas increíbles pero esto podría haberse introducido antes y podría haber sido muy interesante y divertido pero nunca se hizo.

¿Cuál creéis que será la primera empresa tocha en dar el salto? Yo sin duda creo que debería de ser Rockstar, Bethesda o Warhorse Studios, digo que serían las que mejor encajarían en un juego así porque al ser mundos abiertos puedes experimentar más, son campos de experimentación bastante buenos para una tecnología así, pero creo que ninguna va a dar el salto por ahora, sería sorprendente si GTA VI implementa algún tipo de tecnología así y sería un gran soplo de aire fresco, algo innovador, aunque podrían haberlo hecho antes y nunca entenderé el motivo por el cual nos han privado de ese tipo de tecnología.


El mayor uso que le di a Kinect.

Los Gritos se podían utilizar mediante el nombre o diciendo las palabras de poder. Era un gran avance disponer de todos los gritos sin tener que ir asignando el que querías.
En la Nintendo DS ya se implementó eso que tu dices (Obviamente no usaba la IA) pero el micrófono fue una de esas implementaciónes junto a las dos pantallas para ser diferente al resto de consola, tiene muchísimos juegos que tiene puedes interactiuar con el micrófono, muchos y se usaba para soplar como el Mario Kart, Zelda...entre otro, también se usaba para decir algunas palabras interactuando con el juego, como Phoenix wright, Brain training o incluso en los Nintendog se usaba para llamar a tu mascota silbando, de echo en este juego justamente podías enseñarle a tu mascota cuentos de palabras y frases registrando tu voz para que hiciera acciones tu perrete😅. Y algunos juegos usaba el micrófono en los chat online.
En la wii juraría que también tenía esto pero fueron menos juegos los que lo usaron. Solo hay que ver los single Star que usa tu registro de voz y tono para jugar.

Usar se ha usado mucho, sobre todo en la Nds que tenía decenas de juego que usaba el Micrófono y tenías que usarlo en muchos juegos si o si. Pero... Se quedó solo en la portátil, en los sobremesa no le sacaron partido a esto por que... Quien sabe, igual vería esto algo como para niños y los sobremesas que ya sabemos que son consola algo más seria y tradicionales y no se quieren mojar.
Porque a nadie le gusta hablar con una maquina que entiende las cosas bien la mitad de veces.
LordVulkan escribió:Porque a nadie le gusta hablar con una maquina que entiende las cosas bien la mitad de veces.


Lo siento no te he entendido, podrías repetirlo de nuevo?
AAA no, pero en VR, donde estas cosas pegan más, hay unos cuantos juegos donde se usa el micrófono.



Porque hay montones de géneros que sería un coñazo añadirlo. No aportarían nada.
carlosniper escribió:
LordVulkan escribió:Porque a nadie le gusta hablar con una maquina que entiende las cosas bien la mitad de veces.


Lo siento no te he entendido, podrías repetirlo de nuevo?

Según él supongo que estarías dando órdenes y el sistema no las agarraría, tendrías que estar pendiente como si fuese un niño de que te haga caso y funcione, un poco la sensación como ocurre con Trico en The last guardian.

Yo creo que si se hubiera diseñado un sistema así en mundos abiertos habría mejor desarrollo, por ejemplo, se hubiera desarrollado ya el mejor sistema para marcar al NPC que vas a hablar, pero es que ya ahora tendría que haber un sistema en que si preguntas al NPC este dice ¿Me preguntas a mi? Además de haber un sistema ya sea de marcado o apuntado que dirija directamente lo que dices a ese personaje y que además tenga en cuenta la distancia y la cercanía.

Incluso el mando tendría que tener un botón de activar y desactivar micro.


@rethen cierto, en vr hay bastante de eso, vi uno ayer buscando vídeos

katatsumuri escribió:
carlosniper escribió:
LordVulkan escribió:Porque a nadie le gusta hablar con una maquina que entiende las cosas bien la mitad de veces.


Lo siento no te he entendido, podrías repetirlo de nuevo?

Según el supongo que estarías dando órdenes y el sistema no las agarraría, tendrías que estar pendiente como si fuese un niño de que te haga caso y funcione, un poco la sensación como ocurre con Trico en The last guardian.

Yo creo que si se hubiera diseñado un sistema así en mundos abiertos habría mejor desarrollo, por ejemplo, se hubiera desarrollado ya el mejor sistema para marcar al NPC que vas a hablar, pero es que ya ahora tendría que haber un sistema en que si preguntas al NPC este dice ¿Me preguntas a mi? Además de haber un sistema ya sea de marcado o apuntado que dirija directamente lo que dices a ese personaje y que además tenga en cuenta la distancia y la cercanía.


@rethen cierto, en vr hay bastante de eso, vi uno ayer buscando vídeos



Es que una ventaja de VR para esto es que el micrófono es un dispositivo presente en todos los HMDs, así que puedes contar con ello para desarrollar.
@rethen no estaría mal que todos los mandos tuvieran micro integrado, no cuesta nada de añadir un micro, que a una de malas si no tienes externo puedas usar el interno.


De hecho acabo de leer que dual sense si tiene micro integrado.
katatsumuri escribió:@rethen no estaría mal que todos los mandos tuvieran micro integrado, no cuesta nada de añadir un micro, que a una de malas si no tienes externo puedas usar el interno.


De hecho acabo de leer que dual sense si tiene micro integrado.


Sí, DualSense lo tiene, pero diría que ni joycon ni mando de Xbox lo tienen, lo cual límita su uso en juegos third party. Lo mismo ocurre con el altavoz integrado.
Plate escribió:Porque hay montones de géneros que sería un coñazo añadirlo. No aportarían nada.

Bueno, no tiene que ser un must necesario en todo, aunque tampoco veo mal que luego se tenga en cuenta en todos los juegos como un elemento interactivo más, adaptado a cada juego, incluso en juegos de plataformas, de hecho últimamente me salía un juego en tiktok que hacía la gente con una gallina de saltar:


Se podrían hacer muchas cosas dentro de un juego con algo así, imagina en un mario tener que ir haciendo sonidos para ir abriendo puertas mientras te tienes que desplazar rápido, el problema que veo es con la gente que no puede hablar.

También hay otros de afinar notas y varios, curioso la verdad, porque a la gente le gusta mucho.


El problema que le veo a muchos ejemplos del pasado es que muchos comandos parecían diccionarios que te tenías que aprender cual examen de la escuela, y mucha gente no está dispuesta a ello, lo suyo en ese entonces sería haberlo implementado de forma espontánea y divertida, que mediante intuición el jugador pueda experimentar y divertirse, nada de algo táctico o matemático, luego quizás si se puede añadir una capa de más profundidad para cosas más complejas, palabras que tengas que aprender.

Por ejemplo, usar insultos o elogios directos a NPCs y que cada palabra pueda afectar diferente a los personajes, hacer un diccionario pero con lo que más se vaya a usar por intuición para que el jugador experimente sin necesidad de recurrir a una guía o un manual, pero esos juegos al contrario parecía que necesitabas aprenderte una lista de comandos.

Por ejemplo, vas a un NPC hombre y le dices "gay", uno se ofende y te viene a pegar, otro te dice que si tienes algún problema con que sea gay, una chica te dice "que dices gilipollas".


Luego indicaciones muy simples: baja, sube, izquierda, derecha, adelante, atrás.


Básicamente es llevar el sistema sin que nadie tenga que leerse ningún manual, el jugador va a su bola y va probando.
katatsumuri escribió:
Plate escribió:Porque hay montones de géneros que sería un coñazo añadirlo. No aportarían nada.

Bueno, no tiene que ser un must necesario en todo, aunque tampoco veo mal que luego se tenga en cuenta en todos los juegos como un elemento interactivo más, adaptado a cada juego, incluso en juegos de plataformas, de hecho últimamente me salía un juego en tiktok que hacía la gente con una gallina de saltar:


Se podrían hacer muchas cosas dentro de un juego con algo así, imagina en un mario tener que ir haciendo sonidos para ir abriendo puertas mientras te tienes que desplazar rápido, el problema que veo es con la gente que no puede hablar.

También hay otros de afinar notas y varios, curioso la verdad, porque a la gente le gusta mucho.




Como mecánica aislada puede ser interesante para dar variedad a un videojuego, pero yo creo que sería un poco coñazo diseñar un videojuego entero en base a esto. Por ejemplo, cosas como el Skyrim con lo del Chatgpt hace gracia al principio, y está bastante curioso la verdad, pero al final, lo que uno quiere en estos juegos es jugar. Un ejemplo es que yo ahora estoy jugando a Path of exile 2 y los NPCs me la suda bastante la verdad, lo que quiero es matar bichos y conseguir mejor equipo, que realmente es núcleo del juego y lo realmente divertido, y como yo muchos. Si tuviera que tener una interacción con voz con cada personaje que me encuentro, al final lo que pasaría es que me parecería un coñazo la mecánica. No lo veo como un elemento indispensable de no retorno la verdad. Al final pasada la novedad no aportaría mucho más allá de echarte unas risas o parecerte curioso en ciertos momentos muy específicos de un videojuego. Aun así se podría utilizar en cosas chulas como cuando tienes que escoltar a un personaje en un videojuego, dándole órdenes para que no te joda las misiones😂 o en un juego táctico tipo XCOM también estaría chulo, pero como algo que marque un antes y un después o un punto de no retorno(para mí esto último no existe, sino que se lo digan a los indies) la verdad es que no lo veo.
katatsumuri escribió:El problema que le veo a muchos ejemplos del pasado es que muchos comandos parecían diccionarios que te tenías que aprender cual examen de la escuela, y mucha gente no está dispuesta a ello, lo suyo en ese entonces sería haberlo implementado de forma espontánea y divertida, que mediante intuición el jugador pueda experimentar y divertirse, nada de algo táctico o matemático, luego quizás si se puede añadir una capa de más profundidad para cosas más complejas, palabras que tengas que aprender.

Por ejemplo, usar insultos o elogios directos a NPCs y que cada palabra pueda afectar diferente a los personajes, hacer un diccionario pero con lo que más se vaya a usar por intuición para que el jugador experimente sin necesidad de recurrir a una guía o un manual, pero esos juegos al contrario parecía que necesitabas aprenderte una lista de comandos.

Por ejemplo, vas a un NPC hombre y le dices "gay", uno se ofende y te viene a pegar, otro te dice que si tienes algún problema con que sea gay, una chica te dice "que dices gilipollas".


Luego indicaciones muy simples: baja, sube, izquierda, derecha, adelante, atrás.


Básicamente es llevar el sistema sin que nadie tenga que leerse ningún manual, el jugador va a su bola y va probando.


Tirando de IA puedes hacer estas cosas en Skyrim (en VR mejor)

La famicom ya tenia microfono integrado en el mando hace mas de 40 años. Creo que la version japonesa del Zelda lo usaba
Un juego genial e infravalorado lo tenia en ps3 y pc, Binary Domain, yo solo puedo hablar de mi experiencia personal, pero fue horrible, la mayoria de las veces fallaba, otras, tenias que hablar muy alto (olvidate de jugar por la noche) etc, era tan frustrante, que no volvi a usar el microfono, porque por suerte, podias desactivarlo y elejir las ordenes con el mando.
Independientemente de lo pulido o perfeccionado que este en otros juegos, opino lo mismo que otros usuarios, seria un coñazo, y yo añado, una paradoja, porque, ¿donde pones los limites?, si fuese super sencillo, a lo mejor pensariamos, pues vaya, para estas 4 palabras, que no lo hubiesen puesto.
Pero, ¿y si fuese muy complejo o extenso?, ¿de verdad estariamos dispuestos a mantener largas conversaciones o incluso solo preguntas sencillas, pero muchas, en un rpg con muchisimos npcs?, no lo creo, acabariamos hartos.
Si alguna vez se estandarizase con todo el auge de la IA, yo solo pediria que hubiese una opcion para desactivarlo, asi podrias cambiar al modo que quisieras en cualquier momento.
17 respuestas