Genial que haya aparecido
este PDF aqui, yo lo use en 3djuegos para demostrar
a algun usuario afin
a las teorias MisterXmedia and friends que eran completamente erróneas
y que Microsoft ya hací
a tiempo habí
a publicado en el IEEE una revista informática de primer nivel académico la información de su gpu bastante detallada.
Si se me permite el enlace lo pongo aqui
http://www.3djuegos.com/foros/tema/34095384/14/project-cars-funcionara-a-60-imagenes-por-segundo-en-xbox-one/ Si no decídmelo
y lo quito, simplemente es para que veais que esto no ha surgido ahora de repente, que es mas bien digamos
un movimiento de autodefensa,
un poco raro e inútil, pero bueno. Era dificil montar una defensa sobre esto medianamente consistente.
Han tardado mucho en darse cuenta de
este documento aquellos que presumen de información confidencial por
ser o trabajadores de Microsoft o no sabemos muy bien que, puesto que
este documento yo lo conocí
a hace más de 6 meses
y habí
a de hecho una versión idéntica
a esta en otra revista de hardware académica de noviembre del 2013 pero con la información anterior sin el Oc posterior hecho por Microsoft.
Como digo el documento tiene ya tiempo, mucho tiempo concretamente publicado en el IEEE el 05 marzo 2014
http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6756701En el se cuenta básicamente la información que microsoft por otro lado ha dicho en multitud de entrevistas
y declaraciones.
Vamos
a quedarnos con la información oficial, los dos diagramas de arriba, el conocido del hotchip
y el publicado en el IEEE
y obviemos la libre interpretación de Mxm
http://ic.pics.livejournal.com/misterxmedia/21549619/174999/174999_original.jpgComo vemos es muy similar.
La idea es básicamente la misma donde tenemos como antes los 2 procesadores de comandos para pintado
y gpgu
y la implementación de coherencia de cache custom (que no hUMA ya que ni ps4 ni Xbo son hUMA si no que cada una tiene una implementación de coherencia de cache customizada como dijo la propia AMD)
http://www.pcper.com/news/General-Tech/Sony-PlayStation-4-PS4-will-NOT-utilize-AMD-hUMA-Kabini-based-SoCTampoco es cierto que Xbo no tuviese coherencia de caches como algún fan de Sony ha estado comentando reiteradamente en algunos foros aunque como digo esto hacia tiempo que se sabí
a.
- El ancho de banda que nuevamente Ms confirma que es 68 GB/s ddr3
y 204 GB/s máximo 109 minimo 140 GB/s en media para la ESRAM con
un ancho de banda sostenido (sumando ddr3
y esram) de 200 GB/S Nada que ver con cifras inverosimiles de 250 GB/s de la ddr3 o 700 GB/s de la sram que llegaron
a publicar.Por ejemplo aqui
http://www.3djuegos.com/comunidad-foros/tema/30432148/0/sistema-de-memoria-de-la-xbox-one/ Primera mentira desmentida.
(Peak DRAM bandwidth is 68 Gbytes per
second. Peak SRAM bandwidth ranges between 109 and 204 Gbytes per second, depending on the mix of transactions. Sustainable total peak bandwidth is about 200 Gbytes per second)- Segundo
(Main memory consists of 8 Gbytes of low cost DDR3 external DRAM and 32 Mbytes of internal SRAM. This provides necessary bandwidth while saving power and considerable cost over wider or faster external DRAM-only alternatives) Microsoft explica el principal propósito de la esram: ofrecer ancho de banda
y una solución de memoria mas barata
y de similar eficiencia que otros sistemas (lease GDDR5) con mas ancho de banda maximo o cantidad. Esto desmiente una afirmación de que la consola xbo tiene
un valor muy por encima del precio de venta
y es por eso por lo que para evitar multas por competencia desleal no han liberado todo el poder de golpe-
Segunda mentira desmentida.- No aparecen ni los FPGAs, ni la memoria apilada, ni los nosecuantos procesadore ARM por ningún sitio. Como ya se sabe hay
un procesador ARM al igual que en ps4 en la placa para temas de seguridad
y del sistema.
Tercer dato puesto en cuestión.- Habia una afirmación que decia que la cpu de xbox one triplicaba
a la de ps4 por tener 6 instrucciones por ciclo vs 2. Realmente son 6 instrucciones por ciclo vs 4 de ps4 (lo de 2 no se donde salió)
y esas instrucciones por ciclo adicionales son muy probablemente de movimiento de datos. Pero bueno aqui no hay nada al respecto... Si realmente la cpu de de xbo estuviese tan modificada como para conseguir triplicar el rendimiento del jaguar normal, habrían dicho algo evidentemente... pero más concretamente dicen esto: (
Jaguar provides good performance and excellent power-performance efficiency. The CPU contains minor modifications from earlier Jaguar implementations to support two clusters and increased CPU cache coherent bandwidth.) vamos que las modificaciones son mínimas
y simplemente enfocadas
a soportar dos clusters (las dos cpus unidas)
y el incremente del ancho de banda
a 30 GB/s vs 20 GB/s en ps4 por ejemplo. Creo que todos entendemos que triplicar el rendimiento estaria dentro de una modificación que no podríamos calificar como MINOR.
Cuarta información falsa desmentida por Ms.- Los 4 renders backends....
http://www.vgleaks.com/world-exclusive-orbis-unveiled-2 Estas son las especificaciones de ps4 filtradas por vgleacks
GPU is based on AMD’s “R10XX” (Southern Islands) architecture
DirectX 11.1+ feature set
Liverpool is an enhanced version of the architecture
18 Compute Units (CUs)
Hardware balanced at 14 CUs
Shared 512 KB of read/write L2 cache
800 Mhz
1.843 Tflops, 922 GigaOps/s
Dual shader engines
18 texture units
8 Render backends Efectivamente como han comentado por ahí los render backends van asociados
a los rops. No hace falta decir mas.
- Tema doble contexto gráfico: Las gpus modernas utilizan varios contextos que permiten por ejemplo calcular en gpgpu mientras la gpu no pinta porque está parada por que la cpu no la alimenta. Aprovechamiento de los tiempos muertos. En esto estoy seguro que Microsoft ha modificado seriamente la gpu para que maximize el throughput.. de hecho insiste mucho en el artículo... Desde luego esto no es tener 2 GPus es tener una gpu muy bien utilizada. Tener dos colas de comandos, data move engine
y esram puede seguramente diluir la teorica superioridad en acs de ps4, ya que como la propia Sony reconoce su gpu está pensada para utilizar 14 compute units no los 18 porque ni tiene ancho de banda, como tampoco puede usar sus rops
a full por el mismo motivo. Ni seguramente pueda paralelizar muy bien los calculos gpgpu
y gráficos
y por eso tuvieron que meterle 6 ACES
y dejar 4 rops donde recomiendan usarlos en computación gpgpu. Así que esto es bueno para xbo one, pero de ahí
a decir que xbox one tiene 2 gpus.... También se utiliza esto para hacer la función de dibujar la tv sobre la imagen del juego
y viceversa.
- El motor de audio puede suplir hasta 2 cores de cpu, algo que de hacer el sonido por cpu en ps4 hace que el rendimiento de cpu en xbox one sea mucho mejor ya que tiene mas cpu para otros menesteres. (
The processors support applications and system services with multiple work queues. Collectively they would require two CPU cores to match their audio processing capability.) ¿Os suena assassins creed Unity?
- Tema dark silicion... vamos
a ver genial que puedan apagar uno de los dos cores... es que eso ya lo dijeron que la consola estaba ideada para minimizar el consumo
y el ruido que generaba... no veo el jubilo salvo por el ahorro energético que está muy bien pero bueno... para eso mejor una wii u que esa si que es
un mecherete.
EDITO
- Sobre DX 12
y porque la mejora de rendimiento
será mayor. Ojo yo considero que en Xbo el rendimiento mejorará. Ha llegado
a mi información de
un 25 o 30% de rendimiento adicional, no llega al 50 o 60 que parece saca en pc en algunos casos, aunque esto tomarlo con pinzas porque no puedo demostrarlo con fuentes primarias...
A lo que voy es que yo creo que si mejorará pero si que es cierto que no como en pc.
Y aqui en el articulo lo explica, microsoft ya lo dijo, parte de las cosas que tiene DX 12 ya están implementadas en xbox one (
The GPU contains AMD graphics technology supporting a customized version of Microsoft DirectX graphics features. Hardware and software customizations provide more direct access to hardware resources than standard DirectX. )
FIN EDICIÓN
Y bueno pues no hay mucho más que decir... vamos que si que
este articulo refleja fielmente la arquitectura de xbox one, firmado por sus arquitectos
y publicado en el IEEE ¿Que ma´s se puede pedir?, que ya lo sabíamos desde hace meses (marzo de
este año). Lo increible es donde llega la gente para intentar utilizar
un paper que desmonta todo lo que han dicho justo en la dirección contraria... Flipando... pero bueno. Esto es lo que hay, si se lee con detenimiento esta es la realidad de xbox one:
- No hay apilamiento
- No hay doble gpu ni el doble de alus (dice claramente 12 compute units 1,31 tflops o lo que es lo mismo 768 alus * 2 instrucciones por ciclo * 853 Mhzs.)
- No hay FPGAs que hagan de doble gpu ni nada parecido.
- No hay coprocesadores ARM
- No hay cpu para alimentarlos si lo hubiere (se desmiente el triple de cpu que ps4)
- No hay ancho de banda para alimentarlos si lo hubiere (se desmienten lso anchos de banda fliping de nuevo)
Y esto es como muchos de vosotros que no habeis entendido el articulo decis, palabra de microsoft
y de sus ingenieros publicado en una revista académica del prestigio de la IEEE. Así pues podeis contradecirla si quereis pero es
un ejercicio de imaginación desde mi punto de vista demasiado circense...
Un saludo.
PD: Algunas notas adicionales de AMD sobre los multiples contextos gráficos que están en la GCN, etc, para que veais que esto no es ciencia ficción o que xbo venga del futuro:
http://developer.amd.com/wordpress/media/2013/06/2620_final.pdf- Página 40: Multiple Concurrent Contexts Multiple ACE paths
- Microsoft ya dijo hace tiempo que habí
a modificado los compute commands (ultimo punto de la transparencia)
http://pc.watch.impress.co.jp/img/pcw/docs/612/762/12.jpgde forma que los 2 Aces
serí
a más eficientes
y estarían mas compenetrados con el resto del sistema, los data move engine
y los coprocesadores. Esos 16 stream works por Ace sirven para aprovechar al máximo la gpu
y es como si dijesemos tuviera "más aces" que sólamente 2, porque son ACEs customizados.