El teorema de Fourier dice que cualquier señal, por complicada que sea, se puede expresar como una suma de funciones seno y coseno. Es decir, en cada instante, un sonido se podría modelar como un conjunto enorme de funciones seno y coseno, pero eso es completamente intratable, yo ahora estoy dando procesado de señal de voz y existen unos modelos bastante complicados que simulan el comportamiento de la boca y de las cuerdas vocales para poder hacer aproximaciones a la señal de voz, para luego poder utilizarlo por ejemplo a la hora de comunicaciones móviles, etc. Por eso te digo, que a lo único que se aspira es a hacer unos modelos del sonido, pero de entrada se presupone que no va a ser exacto, ya que aunque sería teóricamente posible, en la práctica es imposible pq harían falta infinitos términos para conseguir la exactitud. Y estamos hablando para un solo instante, así que ya ni te digo para un periodo de tiempo no finito. Lo que se hace es por ejemplo comparar la característica del sonido como su periodicidad, sus picos y otros factores para ver a qué sonido se parece más de los existentes en un banco de datos, y luego lo que se manda es digamos el numerito correspondiente al sonido pronunciado, con lo que en realidad en el destino se escucha un procesamiento de la señal donde tu ya no escuchas la voz de la persona, sino fonemas del banco de datos. Para esto no hace falta irse muy lejos, el vocoder que llevan los móviles GSM (los que se usan ahora) funciona así. Es bastante interesante, pero es un gran coñazo de estudiar
Enga saludos, si tienes alguna duda más ya sabes