Bueno, comento lo mismo que ya comente sobre esta noticia en otra web.
Tengo muy serias dudas de la eficiencia de un esquema basado en la "similaridad de los archivos" en un entorno real de "produccion".
Si habeis leido la noticia, habreis observado que ese "aumento de velocidad" lo consigue mediante la tecnica de desmenuzar los archivos en una especie de "componentes indivisibles" que supuestamente son similares (o identicos) de un archivo a otro: de modo que no necesitas pedir todos los segmentos de un archivo, sino que algunos o muchos segmentos puedes pedirlos de OTROS archivos, siendo estos presuntamente identicos. Al final se reconstruye el archivo
Haciendo una analogia muy bruta: tu coges un documento, lo desensamblas en sus "componentes" (como por ejemplo, las letras), construyes una especie de indice que posiciona las letras en el papel, y luego, como una A es identica a cualquier otra A, puedes pedir cualquier A de cualquier sitio para componer el documento final.
en el papel, se pueden obtener ratios de compresion muy altos gracias a la redundancia... pero no esta tan claro que esos patrones sean aptos de utilizar en un entorno real, y mas con la mayoria de archivos que se utilizan en las redes de pares (videos, imagenes ISO, etc).
en la practica, tengo mis serias dudas de que, por ejemplo con archivos de video, estos puedan ser descompuestos en elementos indivisibles que sean iguales de un archivo de video a otro como para que tu, pidiendo un archivo de video "lo que sea" se pueda componer a base de trozos de otros archivos de video... mismo caso con cualquier archivo contenedor (incluidos los de imagen, audio y documentos) y mas dificil me resulta aun con archivos comprimidos muy dependientes de su informacion de cabecera, como puedan ser los tipicos RAR o las imagenes ISO.
Donde me resulta mas plausible este sistema, es con archivos de documentos y con binarios, que tienen cabeceras identicas y muchos patrones de datos similares... pero esto no constituye ni el 1% del trafico en una red de pares.
curiosamente, algo similar a esto lo lei en alguna revista hace una pila de años... pero aplicado al almacenamiento de datos.... vosotros lo habeis visto en alguna parte?
Espero equivocarme, pero no, sigo creyendo que "por donde caben 3 no caben 7".
Saludos cordiales.