aelio escribió:isma82 escribió:jose1024 escribió:Que pueda aprovechar mejor la gpu en sus tiempos ociosos no significa que tenga doble gpu, ademas esto seria para GPGPU, osea postprocesos, que esta muy bien, fisicas y calculos de npc y poco mas, lo digo para que algunos dejen de fliparse, de doble gpu nada de nada.
Puede ser gpgpu y dos contextos de render para hacer pich tener dos viewports o imagen stereografica. Aunque las alus y la potencia siguen siendo la misma la tasa de uso se incrementa. Esa es la clave del asunto.
@aelio un par de paginas atrás hay una diagrama de ps4 con dos pipes de renderizado de diferente prioridad. La solución de xbo parece mas flexible y el añadido del procesador de comandos adicional es la parte que han customizado de la versión de pc. Es una solución ac hoc para consola. La idea de múltiples contextos de gpu esta en pc pero no suele que yo sepa disponer de dos procesadores de comandos salvo que tengas dos gpus una por ejemplo integrada en la cpu y otra en el pci expresa.
No soy un entendido, pero dos pipelines gráfico no son dos gfx command processors. No te parece curioso que sea la primera gpu que utiliza esta solución? Además, aunque es cierto que en las transparencias de AMD que mencionabas páginas atrás se habla de múltiples contextos de cómputo, en este caso el paper menciona explícitamente contextos gráficos. Si esto fuera algo que ya incorpora de serie GCN, que sentido tiene mencinarlo en un artículo de corte científico?
Como tú mismo reconoces "...no suele que yo sepa disponer de dos procesadores de comandos salvo que tengas dos gpus...". Por qué te parece tan descabellado que la gente piense que MS ha invertido mucho dinero en diseñar junto con AMD una GPU de nueva generación, a la vista de estas peculiaridades?
Saludos
Yo nunca he dicho que la gpu de xbox one fuera un mal diseño, el problema de la gpu de xbox one es que es poco potente con respecto a lo que cabria esperar de una consola next gen. Las soluciones implementadas en el chip para suplir la falta de ancho de banda de la ddr3 o para dotarle de el mayor uso posible a sus 12 cus están muy bien y son muy interesantes a nivel académico, de ahí el articulo. ÇDes un punto de vista de eficiencia tanto energética como de costes el chip de xbox one es interesante. Pero no es una máquina de alta capacidad computacional. En el paper dicen claramente en varias partes del msimo que ciertas decisiónes han sido tomadas para conseguir reducir costes de fabricación. Desde el momento que las consoals eligieron procesadores AMD Fusion con gpu integrada ya muchos nos hechamos las manos a la cabeza, porque en un mismo chip no puedes meter una cpu potente y una gpu potente y el problema de las consolas es que han tenido que sacrificar por ambos lados para poder hacer chips baratos que hagan consolas baratas. Básicamente.
Una cosa es que la gpu de xbox one tenga modificaciones interesantes que la permitan estar muy bien utilizada, que su arquitectura este mucho mejor balanceada que otras y otra muy distinta que ahora de repente multipliquemos tflops... Si es muy simple. En el paper cuand ophablan del ancho de banda de la máquina suman ddr3 y esram para decirte que, tienen un ancho de banda superior al de otras soluciones (200 GB/s en media) y te hacen esa suma explicita porque lo quieren resaltar. Y porque es correcta al menos de forma teórica. Sin embargo la cifra de potencia en coma flotante que proporciona el artículo es de 1.31 Tflops.
Los pipes son caminos concurrentes que pueden ejecutarse dentro de la gpu. Es decir multiplex contextos concurrentes como todas las gpus que tienen más de un ace.
LA gente confunde multiples contextos concurrentes con el context switching este que aparece en Carrizo. PEro es que no están hablando en el articulo que tengan context switching, es decir que peudan parar un contexto, ejecutar donde esta ese contexto otro y parar este y reanucar el anterior. Eso es Context switching que es distinto de simplemente poder mantener multiples contextos simultaneos, que es lo que pone en el artículo.
Como dice el propio ingeniero de microsoft en el articulo de eurogamer refiriendose al mayor numero de aces de ps4....
DF: The GPU compute comparison seems to be about Xbox One's high coherent read bandwidth vs. raw ALU on PS4. But don't the additional ACEs added to PS4 aim to address that issue?
Andrew Goossen: The number of asynchronous compute queues provided by the ACEs doesn't affect the amount of bandwidth or number of effective FLOPs or any other performance metrics of the GPU.
El numero de procesadores de comandos, sean para gpgpu sea para pintado no incrementan ni el ancho de banda ni el numero efectivo de flops de rendimiento de ninguna gpu. Solo permiten mejorar su utilización.
The number of asynchronous compute queues provided by the ACEs doesn't affect the amount of bandwidth or number of effective FLOPs or any other performance metrics of the GPU. Rather, it dictates the number of simultaneous hardware "contexts" that the GPU's hardware scheduler can operate on any one time. You can think of these as analogous to CPU software threads - they are logical threads of execution that share the GPU hardware. Having more of them doesn't necessarily improve the actual throughput of the system - indeed, just like a program running on the CPU, too many concurrent threads can make aggregate effective performance worse due to thrashing. We believe that the 16 queues afforded by our two ACEs are quite sufficient.
Al contrario, dictan el número de "
contextos" de hardware simultaneos que un programador de hardware de la GPU puede operar en cualquier momento. Puedes pensar de estos contextos como una analogía a los threads de software en una cpu CPU, son hilos lógicos de ejecución
que comparten el hardware de GPU. Tener más de ellos no necesariamente mejora el rendimiento real del sistema - de hecho, al igual que un programa que se ejecuta en la CPU, demasiados hilos concurrentes pueden empeorar la performance total efectiva debido trasiego de información ( e interdependencias entre los datos, que en gpu son menores pero en gpgpu son mas altas sin llegar a ser tan altas como en cpu). Creemos que las 16 colas ofrecidas por cada uno de nuestros ACEs son más que suficiente.
---------------------------------------------------------------
Tener dos procesadores de comandos gráficos o procesadores de comandos de gpgpu tiene ciertas ventajas de utilización (hasta cierto punto como comentan la propia microsoft) pero todos esos comandos y contextos se ejecutan sobre el mismo hardware que es el que en ultima instancia por propia física la limita. Se peude utilizar una consola hasta el ultimo bit. Hasta el ultimo flop. Pero jamás se podrá llevar a la gpu de xbox one mas allá de su limite de potencia que determinan sus cus, que es, segun microsoft de 1.31 Tflops. Como ya he dicho en el hilo reiteradamente, este articulo ya se conocía. Yo lo conocía desde abril o mayo y se publico en marzo. Este articulo no es nuevo, las declaraciones de eurogamer creo incluso son posteriores, esto ya se sabía desde hace tiempo, solo que hay gente que lo ha descubierto ahora y otros que no lo conocía o se negaban a conocerlo cuando minimizaban ciertos aspectos de xbo como que no tinia coherencia de caches o que la coputación asincrona era una birria. Dicho lo cual he de reconocer que yo cuando lo leí se me pasó por alto el tema de que tengan más stream works por ace de lo normal. Releido y con la charla de estos días he caido en eso que se me había pasado por alto y que me parece muy interesante por otra parte. Estoy completamente de acuerdo con el ingeniero que para la gpu que tiene xbox one 16 pipes por ace con 2 aces es mas que suficiente, sobre todo si peude operar en diferentex contextos simultaneos y adapat la gpu a las necesidades de forma tan flexible como parece indicar el paper.
Un saludo.