Veamos lo que yo entiendo es que el bus de comunicaciones
EIB solo se puede iniciar una transferencia cada 3 ciclos y esta
dura 8 ciclos. (por cierto que en otro lado leí que también
puede hacer 3 transferencias concurrentes en según que casos)
Lo que significa que si haces muchos accesos cortos
a memoria pierdes rendimiento.
Afortunadamente las SPU's tiene 256 KB de memoria dedicada
cada una. + 128 registros de 128 bits
Según creo habla de que una transferencia es de
8x128 Bits
Lo que implica que una lectura óptima seria de 128 Bytes.
En cualquier arquitectura de memoria es mejor leer páginas enteres
lo curioso de este caso es que si una SPU pasa un mensaje a otra de
menos de 128Bytes desperdicia recursos.
(EL EIB comunica la SPU la PPU, la cache y la memoria)
Y eso es lo que tienen que tener en cuenta los programadores
cuando tengan que pasar datos entre una unidad y otra.
De todos modos creo que el EIB es bastante rápido
(me parece que eran más de 100 GB/s)
y se refiere a la comunicación no a las operaciones
que pueda hacer internamente cada SPU.
http://www-128.ibm.com/developerworks/power/library/pa-cellperf/?ca=drs-
En la misma WEB podemos ver que un CELL a 3.2 Ghz
puede alcanzar una tasa sostenida de 197 GB/s
(en un determinado caso) si sumaamos todas las transferencias
Transferencia sostenida en experemientos el máximo teorico
es de 204.8GB/s.