@RuSpider En si quieres hacer un Dwonmix, que es hacer una mezcla de varios canales en solo unos cuantos canales. Eso lo puede hacer muchos de los reproductores de PC [PotPlayer, MPC, MPC-HC, MPC-BE, KMPlayer, Kodi o la basurilla de VLC] que cuentan con sus matrices de mezcla de canales de audio. Si el reproductor no cuenta con su matriz de mezcla, puedes usar filtros dedocificadores externos como FAVFIlters o FFDShow-TryOit o AC3Filter, asi cualquier software reproductor que pueda utilizar los decodificadores instalados en windows por DirectShow podran usar la matriz de mezcla de esos decodificadores de audio/video..
Sobre tu problema, parece ser que estas saturando el amplificador al mezlcar los canales. El saturar es que no le das tiempo al cono o membrana del altavoz a volver a una posicion relajada [la posicion de inicio] po rll que siempre esta vibrando y distrocionando el audio.
EL truco es que al ser una mezcla de varios canales para crear una salida debes disminuir la amplitud [onsideremos la amplitud como el volumen de la señal] de todos los canales que vas a mezlcar, asi no saturas la señal nueva que estas creando con la mezcla. Las matrices se manejan con valores numericos que van del 0 [no hay audio en absoluto] hasta 1.0 [se deja pasar tiodo el audio]. Podemos entrender que estos valores del 0 al 1.0 son 'porcentajes' de la amplitud, asi por ejemplo, al dar 1.0 quiere decir que permiter el 100% del nivel [volumen] de la señal de ese canal, asi lo mismo si pones 0.80 estas dejando solo el 80% del nivel de la señal de ese canal, 0.50 es el 50% [la mitad] de esa señal.
Entonces para la mezcla de 5.1 a 2.0, yo dejo [si... llevo años usando matrices de audio de los reproductores o de los filtros decodificadores para hacer downmix] para los canales frontales estereo un valor de 0.70, para el canal central dejo 0.45 [al fin de cuentas es mas bajo porque lo mezclare tanto en el canal derecho como en el izquierdo de la señal de audio estereo que quiero tener], para los estereo traseros dejo 0.50 a 0.55 y el del subwoofer depende, si voy a usar el sistema de audio que tiene su subwoofer lo dejo en 0.70, pero si voy a usar las bocinitas del televisor para no enviciarlas dejo un valor menor, como de 0.45
hilo_como-pasar-audio-de-peliculas-mkv-de-ac3-5-1-a-2-1_2029430hilo_sonido-voces-netflix-bajo_2426824hilo_limitar-sonido_2124279Matriz de mezcla, es lo mismo en PotPlayer, MPC [MPC-HC, MPC-BE], etc., o filtros decodificadores como FavFilters o AC3Filter o FFDShow-TryOut
Columnas: Los canales de entradas [los canales que tieen el sonido de tu video]
Renglones: Los canales que saldran a la tarjeta de sonido o al puerto de audio digital [spdif/hdmi]
Asi en la imagen de arriba para obtener la señal del canal izquierdo del audio estereo, estoy mezclando un % de audio del canal frontal izquierdo [L], junto con un % del canal trasero izquierdo [SL] y del canal lateral izquierdo [BL], un % del canal central [C] y del SubWoofer [LFE]. Lo mismo hago para el canal derecho del audio estereo que usare en la salida, un % del canal frontal derecho [R] + % canal trasero derecho [SR] + % del canal lateral derecho [BL] + % del canal central [C] + % subwoofer [LFE]
Aqui la misma matriz de mezcla en FFDShow-Tryout, la nomenlcatura de los canales es un poco diferente, pero se maneja igual: Columnas son los canales del audio del video y renglones son los canales que queremos enviar a la tarjeta de sonido o a la salida de audio digital [spdif/hdmi]
Los mismos programas estos [reproductores o filtros decodificadores] ya tienen sus presets para el downmix, por si no quieres hacerlo manualmente, pero la verdad el hacerlo manual es mucho mejor porque puedes hacer el ajuste mas optimo para el tipo de bocina que vayas a utilizar [si son pequeñas o son mas grandes]
Aparte del tema de la mezcla de canales de audio para el downmix, tambien esta el tema de tener un volumen que no se exceda de cierto nivel, porque luego hay series o peliculas donde el volumen de dialogos esta algo bajo pero el audio ambiental e incidental es mas alto, y ni que decir del audio de los efectos [explosiones por ejemplo en peliculas de accion] donde por subbir el volumen al televisor para escuchar los dialogos, cuando menos esperamos se nos sacuden las bocinas cuando hay un ruido fuerte. Para evitar eso y tener un volumen mas nivelado entre dialogos y efectos de audio, puedes usar el ecualizador APO ecualizer, y con el un plugin VST de COMPRESOR DE AUDIO [no confundir con un encoder a un formato de sonido comprimido]. Estos compresores de sonido se utilizan en las televisoras y estaciones de radio para mantener un nivel de volumen constante y asi ninguna cancion o locutores tengan un volumen que distorcione las bocinas.
hilo_equalizer-apo-ecualizador-parametrico-con-soporte-vst_2357851El compresor der sonido basicamente se maneja por dos controles, uno de UMBRAL donde establecemos el nivel de audio del cual no queremos pasarnos y el control de RELACION, en el cual indicamos cuanto se atenuara [piensalo como disminuir el volumen] todo ese audio que se pase el umbral que fijamos. Esta relacion se maneja asi 1:1, 2:1, 4:1, etc. Y este se lee Relacion Uno a Uno [1:1], o lo que es lo mismo, por cada dB [decibel, que es la unidad de medida para los niveles de audio] que se pase del umbral se permite pasar el mismo dB [no hay modificacion], Dos a 1 [2:1], por cada dB que se pase del umbral, solo se permite el volumen de la mitad de ese dB; aqui por ejemplo, si el audio que sobrepasa el umbral que fijamos es de 2dB a la salida del sompresor se disminuyo el volumen para que solo pase 1dB, otro ejemplo, si es 1dB lo que sosbre pasa el umbral, el compresor disminuye el volumen para que solo salga 0.5dB. Otro ejemplo, relacion 4 a 1 [4:1] , por cada dB que sobrepase el umbral el compresor solo deja pasar 1/4, asi si el sonido sobrepasa en 4dB el umbral, el compresor solo permite pasar 1dB, otro ejemplo, si el volumen sobrepasa 1dB el umbral el comprsor solo permite pasar 0.25db.
El audio que este opor debajo del umbral no se toca, solo se atenuan los picos de audio que sobrepasen ese umbral, esos picos pueden ser por ejemplo, el audio de una explosion, o el audio de un avion o auto al estrellarse, o la detonacion de una bala. Asi colocando el umbral un poquito por arriba de los dialogos hacemos que el audio de esos efectos de sonido o sonido ambiental sigan sobresaliendo [digo, una explosion debe ser espectacular], pero a la vez evitamos que salga demasiado fuerte y dañe las bocinas ya a la vez mntenemos un sonido mas uniforme.