Hablemos del interior de Xbox One

Yo no te he acusado de ser nada, sólo te he dicho que os leais el paper que era de los que estábamos hablando. Tu has sido el que ha dicho que no habia dos procesadores de comandos, supongo sin habertelo leido. Nada más no te he acusado de nada simplemente de que no veo razonable contradecir un paper en el IEEE de la propia Microsoft.
Editado por ahona. Razón: Quote
Urian está baneado del subforo por "Troll"
isma82 escribió:
KinderRey escribió:
isma82 escribió:
Es que el concepto Full HSA es un concepto difuse... ¿Que es full HSA? Que es mejor la arquitectura hUMA montada en Kaveri o las implementaciones de ps4 y xbo one? pues no lo se. En teoría hUMa es posterior (2013) y las consolas fueron diseñadas en 2012. Luego es de suponer que hUMA sea producto de la investigación en estas consolas y que sea algo más pulido. Pero vamos si la pregunta es Xbox one tiene coherencia de caches? La respuesta es si y lo sabíamos hace mucho tiempo ya.



No es un concepto para nada difuso. Está muy claro en los papers de AMD la diferencia entre "HSA Compliant Features" (aquí se incluye el hUMA) y "Full HSA Features" (aquí se incluye lo anterior y se añade el cambio de contexto, QoS y suspensión de tareas de la GPU o lo que es lo mismo, una GPU realmente multitarea)

Lo cierto es que no sabía si AMD había definido completamente que es lo que ella entiende por Full HSA o no. Gracias por la info. En ese caso en el paper al menos no deja claro todos estos puntos. L oque dice el paper sobre coherencia de caches y computación heterogeneas es esto:
-The design provides 32 GB/second peak DRAM access with hardware-maintained CPU cache coherency for data shared by the CPU, GPU, and other processors. Hardware-maintained coherency improves performance and software reliability.
- The implementation restricts shared CPU- cache-coherent data (and PCIe and audio data, most of which is CPU-cache-coherent) to DRAM for simplification and cost savings. GPU SRAM access and non-CPU-cache-coherent DRAM access bypass CPU cache coherency checking

Que hay limitaciones en la coherencia de cache en la SRAM para reducir costes. Tampoco dice nada de QoS o suspensión de tareas y habla de 2 contextos de ejecución independientes pero eso como he puesto antes en las transparencias de AMD http://developer.amd.com/wordpress/media/2013/06/2620_final.pdf (Página 40: Multiple Concurrent Contexts Multiple ACE paths ) es algo que comparten las gráficas actuales.

A la pregunta de que si xbox one es Full HSA, no lo se, valoralo tu mismo. Yo diría que no o aparecería en el paper igual que explican otras cosas. LA consola debe mantener un precio de fabricación bajo, es bastante probable que se hayan implementado uan solución intermedia que no disparara el coste de fabricación. Desde luego la esram de 8 MB que está por ahi en el chip debe tener algo que ver en todo esto.


32GB/seg... que es el ancho de banda del PCI Express 3.0 x16 con la RAM global en el caso del PC.
marjalone está baneado por "Saltarse el ban con un clon"
Dasny escribió:Cometeis un graso error en dar porcentajes cuando la api no a entrado en accion, ademas de comparar juegos que apenas contemplan, por sus motores graficos multiplataforma las bondades de esta arquitectura.

Primero el sdk o el kit de desarroyo utilizado actualmente esta pensado para salvar la situacion poco a poco de los juegos actuales, los cuales utilizan arquitectura a base de lo que conocemos desde hace 15 años? Cuando los motores del los juegos se adapten a la api directx12 y sus caracteristicas, entonces si podriamos hablar de porcentajes reales puesto que el nuevo paradigma estaria siendo usado.

Opino que ps4 poco tiene que esconder ya que se basa en potencia lineal, a mi entender se salva por ser hardware cerrado con config de pc de gama baja. La salvara el sofware como viene siendo de costumbre.


totalmente de acuerdo

que GPU soporta dos contextos graficos independientes... es curioso porque ninguna GPU del mercado hoy dia soporta varios contextos independientes...
¿Que GPU/APU futura soporta varios contextos graficos independientes?

AMD Carrizo, disponible a partir de 2015...
http://en.wikipedia.org/wiki/AMD_Accele ... chitecture
AMD Carrizo sera FULL HSA 1.0 (y no HSA Compatible, como su hermano Kaveri), tendra una grafica basada en GCN de tercera generacion (o sea, ni GCN 1.0 ni GCN1.1, como su hermano Kaveri) y sera FULL DIRECTX12.

Microsoft lo ha vuelto a hacer, ha lanzado una tecnologia al mercado domestico 2 AÑOS ANTES de su salida oficial. Lo hizo en Xbox con el doble canal a RAM, y lo hizo en Xbox360 con su shaders unificados.

¿de veras alguien dudo que no lo volveria a hacer con XboxONE, despues de un desembolso de 3000 millones de dolares con AMD?
Urian está baneado del subforo por "Troll"
marjalone escribió:
Dasny escribió:Cometeis un graso error en dar porcentajes cuando la api no a entrado en accion, ademas de comparar juegos que apenas contemplan, por sus motores graficos multiplataforma las bondades de esta arquitectura.

Primero el sdk o el kit de desarroyo utilizado actualmente esta pensado para salvar la situacion poco a poco de los juegos actuales, los cuales utilizan arquitectura a base de lo que conocemos desde hace 15 años? Cuando los motores del los juegos se adapten a la api directx12 y sus caracteristicas, entonces si podriamos hablar de porcentajes reales puesto que el nuevo paradigma estaria siendo usado.

Opino que ps4 poco tiene que esconder ya que se basa en potencia lineal, a mi entender se salva por ser hardware cerrado con config de pc de gama baja. La salvara el sofware como viene siendo de costumbre.


totalmente de acuerdo

que GPU soporta dos contextos graficos independientes... es curioso porque ninguna GPU del mercado hoy dia soporta varios contextos independientes...
¿Que GPU/APU futura soporta varios contextos graficos independientes?

AMD Carrizo, disponible a partir de 2015...
http://en.wikipedia.org/wiki/AMD_Accele ... chitecture
AMD Carrizo sera FULL HSA 1.0 (y no HSA Compatible, como su hermano Kaveri), tendra una grafica basada en GCN de tercera generacion (o sea, ni GCN 1.0 ni GCN1.1, como su hermano Kaveri) y sera FULL DIRECTX12.

Microsoft lo ha vuelto a hacer, ha lanzado una tecnologia al mercado domestico 2 AÑOS ANTES de su salida oficial. Lo hizo en Xbox con el doble canal a RAM, y lo hizo en Xbox360 con su shaders unificados.

¿de veras alguien dudo que no lo volveria a hacer con XboxONE, despues de un desembolso de 3000 millones de dolares con AMD?


[carcajad] [carcajad] [+risas]

Si, por eso los arquitectos de la consola dicen que es una Sea Islands, ala GCN 1.1.

No tenéis remedio.
marjalone escribió:¿Que GPU/APU futura soporta varios contextos graficos independientes?

Todas las GPUS AMD Fusion.
AMD http://developer.amd.com/wordpress/medi ... _final.pdf
- Página 40: Multiple Concurrent Contexts Multiple ACE paths
- pagina 3: Multiple Engine Architecture with Multi-Task Capabilities
- pagina 6: Independent & Concurrent Grid/Group Dispatcher, Background task scheduling, Real time task, scheduling Error Detection & Correction (EDCC), For GDDR and internal SRAM Pools
El paper de AMD sobre GCN.
Veo que muchos seguís errando en vuestras explicaciones y no se ya si lo hacéis adrede.Estáis diciendo que los ACES son los que permiten los 2 contextos independientes de gráficos?!!! ZzzZZ
Toda GPU GCN permite trabajos en paralelo pero no 2 contextos gráficos simultáneos.Que básicamente es una emulación de un "hypertreading" en la GPU si no para que han implementado 4 CPs?!Para ejecutar aplis no?! Y si no siempre queda la excusa de "pal kinectk."Vaya huevos [carcajad] Pero bueno OS invito aquí a que me busqueis una GPU actual que permita esa opción.
Eso junto con los anchos de banda anteriores es para mear y no echar gota .Para vuestra info los GB/s sostenidos mientras trabaja la CPU de la que tanto os gusta bajan hasta los 120GB/s,mientras One permite trabajar y comprobado bajo pruebas de stress hasta los 140/150GB/s reales .
Eso del 20 al 30% porque yo lo valgo queda fantástico.De verdad es para aplaudir dando una cifra así por que si sin ver ninguna prueba tangible.
Lo de la CPU OS habéis dejado que Microsoft ha aumentado la coherencia y ha aumentado el ancho de banda de la CPU hasta los 30GB/s.
Lo de w2w y memorias stacked no creo que salgan en algun paper de estos para el publico pero podriais explicar los "expertos" las jugosas fotos del soc de teardown.Donde si ven cosas que hay que explicar y si no lo veis es que ni merece la pena debatir ni postear en estos foros.
Hookun escribió:Veo que muchos seguís errando en vuestras explicaciones y no se ya si lo hacéis adrede.Estáis diciendo que los ACES son los que permiten los 2 contextos independientes de gráficos?!!! ZzzZZ
Toda GPU GCN permite trabajos en paralelo pero no 2 contextos gráficos simultáneos.Que básicamente es una emulación de un "hypertreading" en la GPU si no para que han implementado 4 CPs?!Para ejecutar aplis no?! Y si no siempre queda la excusa de "pal kinectk."Vaya huevos [carcajad] Pero bueno OS invito aquí a que me busqueis una GPU actual que permita esa opción.
Eso junto con los anchos de banda anteriores es para mear y no echar gota .Para vuestra info los GB/s sostenidos mientras trabaja la CPU de la que tanto os gusta bajan hasta los 120GB/s,mientras One permite trabajar y comprobado bajo pruebas de stress hasta los 140/150GB/s reales .
Eso del 20 al 30% porque yo lo valgo queda fantástico.De verdad es para aplaudir dando una cifra así por que si sin ver ninguna prueba tangible.
Lo de la CPU OS habéis dejado que Microsoft ha aumentado la coherencia y ha aumentado el ancho de banda de la CPU hasta los 30GB/s.
Lo de w2w y memorias stacked no creo que salgan en algun paper de estos para el publico pero podriais explicar los "expertos" las jugosas fotos del soc de teardown.


Tiene los comandos duplicados porque tiene la gpu dividida en dos bloques como pone el diagrama (no duplicados como decian algunos). Dos bloques de 6 cus que puede concurrentemente ejecutar simultaneamente una instrucción gpgu en uno de ellos mientras que en el otro puede ejecutar una instrucción de pintado y viceversa o usar lso 12 para pintar, lo que le plazca. El diagrama es bastante claro al respecto y esa es la mayor modificación que ha hecho microsoft sobre la arquitectura junto con los data move engine y la esram. El hyperthriding es otra cosa y además los cores virtuales en el HT tiene un rendimiento de un 25 % - 30 % del core real le pasaba a la 360 por ejemplo, les pasa a los i7). Osea que le des las vueltas que le des no salen 2,6 tflops ni rezandole a bill gates. LA gpu tiene 1,31 Tflops lo ha dicho microsoft 700 veces es dar vueltas a lo mismo una y otra vez. 1.31 Tflops muy bien utilizados? Si, pero 1.31 tflops.

http://developer.amd.com/wordpress/media/2013/06/2620_final.pdf
- Página 40: Multiple Concurrent Contexts Multiple ACE paths
Esta es la tercera vez que lo pongo macho... Una pista ¿Que crees que significa Concurrent? Concurrente es a la vez, Multiples contextos a la vez... vamos no se como quiere que te lo diga AMD. Mas claro es dificil.

Donde si ven cosas que hay que explicar y si no lo veis es que ni merece la pena debatir ni postear en estos foros.

ME quedo con esto último... xD yo solo digo ¿Quien contradice a Microsoft cuando hablas de Stacked GPU o memorias apiladas etc etc etc, tu o yo ? ahí lo dejo. Que cada uno saque sus propias conclusiones. Cada uno ve lo que quiere ver eso esta claro pero ese paper dice lo que dice y no dice lo que algunos les gustaria que dijese tanto a sujetos que decían que Xbo no tenia coherencia de caches y ps4 si, como otros que se han inventado otras cosas en otras direcciones. Hasta un par de paginas era palabra de Dios... ¿ahora ya no?

En cuanto a la comparativa con la ps4, me da igual y te lo digo en serio. Con los datos en la mano xbox one es mas potente en cpu y ps4 en gpu. Eso es algo objetivo. El rendimiento final variara dependiendo de la tasa de uso de cada uno y de otros multiples factores. En Assassins creed va mejor en xbox one porque usa mas la cpu. En Far Cry va mejor en ps4 porque usa más la gpu. Como resumen no se si te vale, pero a mi si. Y realmente me da un poco lo mismo sinceramente. Me parece una minucia en cualquier caso.
isma82 escribió:
Hookun escribió:Veo que muchos seguís errando en vuestras explicaciones y no se ya si lo hacéis adrede.Estáis diciendo que los ACES son los que permiten los 2 contextos independientes de gráficos?!!! ZzzZZ
Toda GPU GCN permite trabajos en paralelo pero no 2 contextos gráficos simultáneos.Que básicamente es una emulación de un "hypertreading" en la GPU si no para que han implementado 4 CPs?!Para ejecutar aplis no?! Y si no siempre queda la excusa de "pal kinectk."Vaya huevos [carcajad] Pero bueno OS invito aquí a que me busqueis una GPU actual que permita esa opción.
Eso junto con los anchos de banda anteriores es para mear y no echar gota .Para vuestra info los GB/s sostenidos mientras trabaja la CPU de la que tanto os gusta bajan hasta los 120GB/s,mientras One permite trabajar y comprobado bajo pruebas de stress hasta los 140/150GB/s reales .
Eso del 20 al 30% porque yo lo valgo queda fantástico.De verdad es para aplaudir dando una cifra así por que si sin ver ninguna prueba tangible.
Lo de la CPU OS habéis dejado que Microsoft ha aumentado la coherencia y ha aumentado el ancho de banda de la CPU hasta los 30GB/s.
Lo de w2w y memorias stacked no creo que salgan en algun paper de estos para el publico pero podriais explicar los "expertos" las jugosas fotos del soc de teardown.


Tiene los comandos duplicados porque tiene la gpu dividida en dos bloques como pone el diagrama (no duplicados como decian algunos). Dos bloques de 6 cus que puede concurrentemente ejecutar simultaneamente una instrucción gpgu en uno de ellos mientras que en el otro puede ejecutar una instrucción de pintado y viceversa o usar lso 12 para pintar, lo que le plazca. El diagrama es bastante claro al respecto y esa es la mayor modificación que ha hecho microsoft sobre la arquitectura junto con los data move engine y la esram. El hyperthriding es otra cosa y además los cores virtuales en el HT tiene un rendimiento de un 25 % - 30 % del core real le pasaba a la 360 por ejemplo, les pasa a los i7). Osea que le des las vueltas que le des no salen 2,6 tflops ni rezandole a bill gates. LA gpu tiene 1,31 Tflops lo ha dicho microsoft 700 veces es dar vueltas a lo mismo una y otra vez. 1.31 Tflops muy bien utilizados? Si, pero 1.31 tflops.

http://developer.amd.com/wordpress/media/2013/06/2620_final.pdf
- Página 40: Multiple Concurrent Contexts Multiple ACE paths
Esta es la tercera vez que lo pongo macho... Una pista ¿Que crees que significa Concurrent? Concurrente es a la vez, Multiples contextos a la vez... vamos no se como quiere que te lo diga AMD. Mas claro es dificil.

Donde si ven cosas que hay que explicar y si no lo veis es que ni merece la pena debatir ni postear en estos foros.

ME quedo con esto último... xD yo solo digo ¿Quien contradice a Microsoft cuando hablas de Stacked GPU o memorias apiladas etc etc etc, tu o yo ? ahí lo dejo. Que cada uno saque sus propias conclusiones. Cada uno ve lo que quiere ver eso esta claro pero ese paper dice lo que dice y no dice hasta un par de paginas era palabra de Dios... ¿ahora ya no?

Te lo vuelvo a repetir la función de los ACEs no es ese contexto y te vuelvo a repetir que busques una GPU que permita esa opcion.Lo de 2,6tflops?!!y lo de stacked ?!!Me has visto decirlo a mi?Esa es la salida rapida?!Para no explicar lo de teardown?!Ni lo haras porque ya sabemos de que va todo esto.Sin entrar a niveles de MisterX ni cosas de esas solo con datos tecnicos de hard hay mucho que explicar pero uno se cansa ya de ver lo mismo de siempre.Respecto los mismos papeles de las arquitecturas GNC en esos papeles no existe la palabra 2 contextos gráficos simultáneos y diferentes.
Hookun escribió:Respecto los mismos papeles de las arquitecturas GNC en esos papeles no existe la palabra 2 contextos gráficos simultáneos y diferentes.

Venga en serio.... Página 40: Multiple Concurrent Contexts 5º vez.

en cuanto a lo de teardown si te refieres a esto:
http://www.techinsights.com/xbox-one/
Yo no he leído nada incompatible con el paper.


64-bit AMD Jaguar CPU
AMD Radeon GPU with 768 cores
500 GB hard drive storage
802.11 b/g/n Wireless
AMD Radeon GPU with 768 cores
8GB of DDR3 RAM

Xbox X887732-001 Processor DG3001FEG84HR (includes AMD "Jaguar" Cores and AMD Radeon Graphics GPU)
SK Hynix H5TQ4G63AFR 4 Gb (512 MB) DDR3 SDRAM (total of 16 x 512 MB = 8 GB)
Xbox X861949-005 T6WD5XBG-0003 Support Processor
SK Hynix H26M42003GMR 8 GB e-NAND Flash
ON Semiconductor NCP4204 GAE1328G Integrated Power Control IC
Realtek RTL 8151GNM Ethernet Controller
Texas Instruments TPS2590 - 3-V to 20-V High-Current Load Switch for Hotswap Management

Y una estimación de costes de 331 $ poco espacio veo yo aquí para meter hardware del futuro a ese precio de fabricación, pero ese dato os lo habéis pasado por alto imagino...

Si ahí hay algo "raro" según tu, tu serás el que tendrás que demostrar que es así y que es lo que tu crees que es. Yo no tengo que explicar nada porque me remito a lo que dice microsoft en este paper. Todo lo demás pues no se tu sabrás que es lo que hay que explicar y cómo lo explicas con algún documento técnico que así lo acredite. LA información oficial es la de este paper y la de otros que ha publicado microsoft y que van en la misma linea. Si tu quieres salirte de la información oficial para divagar, adelante.
isma82 escribió:
Hookun escribió:Respecto los mismos papeles de las arquitecturas GNC en esos papeles no existe la palabra 2 contextos gráficos simultáneos y diferentes.

Venga en serio.... Página 40: Multiple Concurrent Contexts 5º vez.

en cuanto a lo de teardown si te refieres a esto:
http://www.techinsights.com/xbox-one/
Yo no he leído nada incompatible con el paper.


64-bit AMD Jaguar CPU
AMD Radeon GPU with 768 cores
500 GB hard drive storage
802.11 b/g/n Wireless
AMD Radeon GPU with 768 cores
8GB of DDR3 RAM

Xbox X887732-001 Processor DG3001FEG84HR (includes AMD "Jaguar" Cores and AMD Radeon Graphics GPU)
SK Hynix H5TQ4G63AFR 4 Gb (512 MB) DDR3 SDRAM (total of 16 x 512 MB = 8 GB)
Xbox X861949-005 T6WD5XBG-0003 Support Processor
SK Hynix H26M42003GMR 8 GB e-NAND Flash
ON Semiconductor NCP4204 GAE1328G Integrated Power Control IC
Realtek RTL 8151GNM Ethernet Controller
Texas Instruments TPS2590 - 3-V to 20-V High-Current Load Switch for Hotswap Management

Y una estimación de costes de 331 $ poco espacio veo yo aquí para meter hardware del futuro a ese precio de fabricación, pero ese dato os lo habéis pasado por alto imagino...

Si ahí hay algo "raro" según tu, tu serás el que tendrás que demostrar que es así y que es lo que tu crees que es. Yo no tengo que explicar nada porque me remito a lo que dice microsoft en este paper. Todo lo demás pues no se tu sabrás que es lo que hay que explicar y cómo lo explicas con algún documento técnico que así lo acredite. LA información oficial es la de este paper y la de otros que ha publicado microsoft y que van en la misma linea. Si tu quieres salirte de la información oficial para divagar, adelante.

Venga que vamos a ello vigésimo octava vez...En las GPUs actuales o pintas o computas.A la vez no puedes realizar 2 trabajos.LOS ACES solo permiten hacer mas contextos pero solo en tareas computacionales que no gráficas que es diferente.Para tu info también soy ProPC y no consolero pero hay cosas que no estoy de acuerdo de como se llevan los asuntos tecnicos en estos foros.Respecto a lo de teardown si solo las CUs de una a la otra son diferentes y llevan mas ALUs como esta demostrado en esas fotos no estamos hablando de una misma arquitectura .Eso es impepinable y sabemos muy bien que las cosas en hard no se hacen por estetica si no que es por alguna funcion.
Hookun escribió:Venga que vamos a ello vigésimo octava vez...En las GPUs actuales o pintas o computas.A la vez no puedes realizar 2 trabajos.LOS ACES solo permiten hacer mas contextos pero solo en tareas computacionales que no gráficas que es diferente.Para tu info también soy ProPC y no consolero pero hay cosas que no estoy de acuerdo de como se llevan los asuntos tecnicos en estos foros.Respecto a lo de teardown si solo las CUs de una a la otra son diferentes y llevan mas ALUs como esta demostrado en esas fotos no estamos hablando de una misma arquitectura .Eso es impepinable y sabemos muy bien que las cosas en hard no se hacen por estetica si no que es por alguna funcion.

Te estoy diciendo que eso es lo que te permite tener los procesadores de comandos duplicados y lo que permite utilizar 1 motor de geometria junto con los 6 cus para una y el otro motor de geometría con los otros 6 cus para otra. Mira el diagrama... Para conseguir eso lo que ha hecho microsoft es duplicar las capacidades del ejecutor de comandos. Hay 2 de cada para poder dividir las tareas en 2, pero la pipeline de ejecución tiene las unidades que tiene luego no puede pintar con los 12 cus simultáneamente mientras calcula con los 12 cus gpgu.... Eso es lo que no puede hacer o no puede pintar dos veces dos render targets usando plenamente las 12 cus en cada una de ellas... Si eso es lo que estas insinuando evidentemente no es así porque entonces el paper no pondría 1,31 Tflops. Estan divididas en dos bloques para poder repartir la carga o para si quieren hacer que puedas pintar dos escenas una sobre otro de forma rápida para dibujar por ejemplo una venta del juego mientras pintas el deshboard o incrustar tv en el juego o viceversa. Pero Multiple Concurrent Contexts por 6º vece lo pueden hacer todas las gráficas. En cuanto a lo de teardown, insisto nuevamente y te remito al paper. 1,31 tflops es el resultado 768 alus por 2 instrucciones por ciclo por los 853 Mhzs de velocidad. Tu busca lo que quieras y explica lo que quieras explicar. ahora te digo, a los mismos nanometros (28) una alu que ocupa la mitad tiene la mitad de hardware. Eso si que está claro y cristalino. Si quieres argumentar en contra trea evidencias y entonces podremos discutirlas o te dire, a pues si tienes razón. Lo demás es divagar y contradecir la información oficial publicada en el IEEE nada menos. Tu sabras si no quieres creerte la información de microsoft. Yo te digo lo que dice el paper que es lo que lleva diciendo microsoft repito desde marzo que se publico. Que no es nuevo este paper ni estaba tan oculto.

Y por ahi atrás no se si a ti o a oro habái leido que esto permite renderizar a dos resoluciones.... Cualquier gpu puede renderizar dos render targets o 27 a resoluciones diferentes. De hecho se hace constantemente en todos los juegos usando diferentes viewports o diferentes cámaras y mezclandolas. Lo puede hacer hasta la Wii u.
isma82 escribió:
Hookun escribió:Venga que vamos a ello vigésimo octava vez...En las GPUs actuales o pintas o computas.A la vez no puedes realizar 2 trabajos.LOS ACES solo permiten hacer mas contextos pero solo en tareas computacionales que no gráficas que es diferente.Para tu info también soy ProPC y no consolero pero hay cosas que no estoy de acuerdo de como se llevan los asuntos tecnicos en estos foros.Respecto a lo de teardown si solo las CUs de una a la otra son diferentes y llevan mas ALUs como esta demostrado en esas fotos no estamos hablando de una misma arquitectura .Eso es impepinable y sabemos muy bien que las cosas en hard no se hacen por estetica si no que es por alguna funcion.

Te estoy diciendo que eso es lo que te permite tener los procesadores de comandos duplicados y lo que permite utilizar 1 motor de geometria junto con los 6 cus para una y el otro motor de geometría con los otros 6 cus para otra. Mira el diagrama... Para conseguir eso lo que ha hecho microsoft es duplicar las capacidades del ejecutor de comandos. Hay 2 de cada para poder dividir las tareas en 2, pero la pipeline de ejecución tiene las unidades que tiene luego no puede pintar con los 12 cus simultáneamente mientras calcula con los 12 cus gpgu.... Eso es lo que no puede hacer o no puede pintar dos veces dos render targets usando plenamente las 12 cus en cada una de ellas... Si eso es lo que estas insinuando evidentemente no es así porque entonces el paper no pondría 1,31 Tflops. Estan divididas en dos bloques para poder repartir la carga o para si quieren hacer que puedas pintar dos escenas una sobre otro de forma rápida para dibujar por ejemplo una venta del juego mientras pintas el deshboard o incrustar tv en el juego o viceversa. Pero Multiple Concurrent Contexts por 6º vece lo pueden hacer todas las gráficas. En cuanto a lo de teardown, insisto nuevamente y te remito al paper. 1,31 tflops es el resultado 768 alus por 2 instrucciones por ciclo por los 853 Mhzs de velocidad. Tu busca lo que quieras y explica lo que quieras explicar. ahora te digo, a los mismos nanometros (28) una alu que ocupa la mitad tiene la mitad de hardware. Eso si que está claro y cristalino. Si quieres argumentar en contra trea evidencias y entonces podremos discutirlas o te dire, a pues si tienes razón. Lo demás es divagar y contradecir la información oficial publicada en el IEEE nada menos. Tu sabras si no quieres creerte la información de microsoft. Yo te digo lo que dice el paper que es lo que lleva diciendo microsoft repito desde marzo que se publico. Que no es nuevo este paper ni estaba tan oculto.

Y por ahi atrás no se si a ti o a oro habái leido que esto permite renderizar a dos resoluciones.... Cualquier gpu puede renderizar dos render targets o 27 a resoluciones diferentes. De hecho se hace constantemente en todos los juegos usando diferentes viewports o diferentes cámaras y mezclandolas. Lo puede hacer hasta la Wii u.

Entonces según tu como la R9 -290x tiene 4 motores de teselacion para cada 8 CUs tendría 8 commands processors y ejecutaría 4 contextos diferentes...
Pues va a ser que no porque sigue teniendo un solo command processor así que tu "explicacion" no es valida .El truco esta en que la GPU de One puede renderizar y computar simultáneamente y no tener que esperar a que termine una cosa para hacer la otra.Lo de las CUs y las ALUs apoya la teoria totalmente.Lo que para mi One computacionalmente es mucho mas poderosa que las GPUs de su categoria.Viendo esas dobles ALUs podría significar los 1,3 Tflops en DP ,lo que quiere decir que no tendría perdidas la GPU al trabajar bajo computación frente a las GCN 1.1 que son 1 a 8.Vamos que una 7870 o 270x se quedan en apenas 300gflops en DP.
Hookun escribió:Entonces según tu como la R9 -290x tiene 4 motores de teselacion para cada 8 CUs tendría 8 commands processors y ejecutaría 4 contextos diferentes...
Pues va a ser que no porque sigue teniendo un solo command processor así que tu "explicacion" no es valida .El truco esta en que la GPU de One puede renderizar y computar simultáneamente y no tener que esperar a que termine una cosa para hacer la otra.Lo de las CUs y las ALUs apoya la teoria totalmente.Lo que para mi One computacionalmente es mucho mas poderosa que las GPUs de su categoria.Viendo esas dobles ALUs podría significar los 1,3 Tflops en DP ,lo que quiere decir que no tendría perdidas la GPU al trabajar bajo computación frente a las GCN 1.1 que son 1 a 8.Vamos que una 7870 o 270x se quedan en apenas 300gflops en DP.


Si solo tiene un graphic command processor solo podrá usar uno. En el caso de xbox one tiene 2 graphic processor como decla el paper. Dependerá de los procesadores de comandos que disponga. Todas las gpus pueden hacer gpgpu en los tiempos muertos del pintado para eso están los aces. pero mientras pintas no pudes usar las mismas alus para gpgpu porque se están usando para pintar. Y no hay alus duplicadas segun este paper insisto y segun le propio sentido común como te he dicho antes. Cuando calculas los tflops tienes en cuenta el numero de instrucciones que estas pueden ejecutar. De hecho las GCN pueden ejecutar 2 por ciclo por eso tiene 1,31 tflops y no la mitad. Si la gpu pudiese ejecutar dos instrucciones de pintado provenientes de dos procesadores de comandos de forma paralela pues tendrái el doble de tflops y no es así. Fácil de entender. En cuanto a lo de doble precisión que ya lo habiamos olvidado volvemos al mismo tema... ¿doble precisión para que? y a santo de que quere micorosft usar calculo de doble precisión en vez de simple precisión... de donde te lo sacas porque insisto en el paper no poner la precisión, porque ¿A caso hace falta ponerla? xD vamos que siempre se dan los datos en simple precisión porque para videojeugos no es necesario hacer calculo en doble precisión... que no nos va la vida en ello porque la gpu se equivoque en una milésima en el redondeo.... Completamente absurdo.

Estas sistemáticamente buscando vueltas donde no las hay. Salir a estas alturas con lo de la doble precisión es [fies]
isma82 escribió:
Hookun escribió:Entonces según tu como la R9 -290x tiene 4 motores de teselacion para cada 8 CUs tendría 8 commands processors y ejecutaría 4 contextos diferentes...
Pues va a ser que no porque sigue teniendo un solo command processor así que tu "explicacion" no es valida .El truco esta en que la GPU de One puede renderizar y computar simultáneamente y no tener que esperar a que termine una cosa para hacer la otra.Lo de las CUs y las ALUs apoya la teoria totalmente.Lo que para mi One computacionalmente es mucho mas poderosa que las GPUs de su categoria.Viendo esas dobles ALUs podría significar los 1,3 Tflops en DP ,lo que quiere decir que no tendría perdidas la GPU al trabajar bajo computación frente a las GCN 1.1 que son 1 a 8.Vamos que una 7870 o 270x se quedan en apenas 300gflops en DP.


Si solo tiene un graphic command processor solo podrá usar uno. En el caso de xbox one tiene 2 graphic processor como decla el paper. Dependerá de los procesadores de comandos que disponga. Todas las gpus pueden hacer gpgpu en los tiempos muertos del pintado para eso están los aces. pero mientras pintas no pudes usar las mismas alus para gpgpu porque se están usando para pintar. Y no hay alus duplicadas segun este paper insisto y segun le propio sentido común como te he dicho antes. Cuando calculas los tflops tienes en cuenta el numero de instrucciones que estas pueden ejecutar. De hecho las GCN pueden ejecutar 2 por ciclo por eso tiene 1,31 tflops y no la mitad. Si la gpu pudiese ejecutar dos instrucciones de pintado provenientes de dos procesadores de comandos de forma paralela pues tendrái el doble de tflops y no es así. Fácil de entender. En cuanto a lo de doble precisión que ya lo habiamos olvidado volvemos al mismo tema... ¿doble precisión para que? y a santo de que quere micorosft usar calculo de doble precisión en vez de simple precisión... de donde te lo sacas porque insisto en el paper no poner la precisión, porque ¿A caso hace falta ponerla? xD vamos que siempre se dan los datos en simple precisión porque para videojeugos no es necesario hacer calculo en doble precisión... que no nos va la vida en ello porque la gpu se equivoque en una milésima en el redondeo.... Completamente absurdo.

Estas sistemáticamente buscando vueltas donde no las hay. Salir a estas alturas con lo de la doble precisión es [fies]

Como?!! Hay 4 CPs : 2 para controlar los shaders(graficos) que son los graphics commands y 2 mas para controlar los compute commands dicese para los ACEs. Así que no tiene sentido alguno eso que me estas contando de hacer 6 gfx+6 DP porque es debido a la dualidad de los CPs y no tiene nada que ver. Seguimos insitiendo ahora en los motores de teselacion para explicar que haya mas de un CPs?!! Pero es que no te das cuenta de lo que dices no concuerda con nada porque todas GCN llevan dual motor geométrico o mas segun la GPU desde la serie 7790 en adelante?!? Por lo tanto todas deberian hacer eso. Te has parado a pensar por un momento que quizas eso es para sacar partido al DX12?!! Y estas dando palos de ciego?!!
Lo de las ALUS si se ven en las fotos así que es comprobable al 100% pero ya estamos como no lo digan en los papeles no vale. Lo de los tflops ya me lo se muy bien pero eso no es extrapolable a sacar la DP.Porque no se dan los datos de las GPUs en DP?!Pues como hasta ahora no era algo que le diera uso normal pues nunca las han dado.Pero para tu información la computación se usa en físicas ,iluminación,post procesados y Crytek en su cry engine nuevo usa la computación junto con la renderización basandose mucho en los compute shaders. Así que ya tienes una idea de porque usarlos. Despues de Quantun break vamos a ver motores que si les saquen partido.Pero bueno como se que me vas a seguir igual he decidido que abandono el post porque aquí hay poco que debatir y no no te doy la razón porque no la tienes ,ninguna explicacion es convincente ni tiene fundamento tecnico. Asi que animo campeón que te dejo para ti solo el post para que vayas dando clases a tus fieles seguidores.
A ver que todo esto se simplifica en lo que ya se sabía, de una forma burda se resume en que es una arquitectura muy optimizada, pensada en la eficiencia, para obtener un mayor rendimiento efectivo (rendimiento bruto * eficiencia = rendimiento efectivo).

Hacer un driver para dicha arquitectura y que sea eficiente no es fácil, cuando se consiga una comunicación y uso real de todos los componentes y buses en la medida de lo posible (el 100% no existe) es cuando se verá lo que da de sí. En cualquier caso no quita que tenga la mayor eficiencia cómputo/watio, recordemos que lo que hace es consumiendo 120W con Kinect y 105W sin éste. Que en parte también se trata de eso, investigar nuevas tecnologías para el futuro, y el del incremento de eficiencia se va ya necesitando.

El DX12 de cara a XOne no es ni más ni menos que dar la posibilidad de usar esta arquitectura a códigos portables. Porque para juegos muy exclusivos se puede usar la otra API sin problemas.
Urian está baneado del subforo por "Troll"
marjalone escribió:
Dasny escribió:Cometeis un graso error en dar porcentajes cuando la api no a entrado en accion, ademas de comparar juegos que apenas contemplan, por sus motores graficos multiplataforma las bondades de esta arquitectura.

Primero el sdk o el kit de desarroyo utilizado actualmente esta pensado para salvar la situacion poco a poco de los juegos actuales, los cuales utilizan arquitectura a base de lo que conocemos desde hace 15 años? Cuando los motores del los juegos se adapten a la api directx12 y sus caracteristicas, entonces si podriamos hablar de porcentajes reales puesto que el nuevo paradigma estaria siendo usado.

Opino que ps4 poco tiene que esconder ya que se basa en potencia lineal, a mi entender se salva por ser hardware cerrado con config de pc de gama baja. La salvara el sofware como viene siendo de costumbre.


totalmente de acuerdo

que GPU soporta dos contextos graficos independientes... es curioso porque ninguna GPU del mercado hoy dia soporta varios contextos independientes...
¿Que GPU/APU futura soporta varios contextos graficos independientes?

AMD Carrizo, disponible a partir de 2015...
http://en.wikipedia.org/wiki/AMD_Accele ... chitecture
AMD Carrizo sera FULL HSA 1.0 (y no HSA Compatible, como su hermano Kaveri), tendra una grafica basada en GCN de tercera generacion (o sea, ni GCN 1.0 ni GCN1.1, como su hermano Kaveri) y sera FULL DIRECTX12.

Microsoft lo ha vuelto a hacer, ha lanzado una tecnologia al mercado domestico 2 AÑOS ANTES de su salida oficial. Lo hizo en Xbox con el doble canal a RAM, y lo hizo en Xbox360 con su shaders unificados.

¿de veras alguien dudo que no lo volveria a hacer con XboxONE, despues de un desembolso de 3000 millones de dolares con AMD?


Ejem...

Imagen

No es el único sistema con dos procesadores de comandos gráficos. [+risas]

El cambio de Microsoft en el sistema no esta en la GPU misma, sino en el hecho que en vez de utilizar el IOMMUv2 de AMD para comunicar CPU y GPU por un lado y CPU con el controlador de memoria...

Imagen

Esta configuración es la estándar de AMD, utilizada en el AMD Kaveri en PC y el procesador de la PlayStation 4. En este caso tenemos dos buses, uno que es coherente (Onion+) y da un ancho de banda de 10GB/seg entre CPU y GPU y otro que no es coherente (Onion) con un ancho de banda 20GB/seg que comunica la CPU con el controlador de memoria del sistema.

En cambio en el caso de Xbox One tenemos una solución distinta:

Imagen

Ya no tenemos el IOMMUv2 de AMD en el caso de Xbox One, esta es la parte que han cambiado por completo y es hecha a medida. Por lo que no han tocado la GPU sino el mecanismo que comunica CPU y GPU.
Solo un apunte, la diferencia de pixeles no es la diferencia de potencia.
Bueno, al menos se empieza ha aceptar q la única GPU actual con dos contextos simultáneos es la de One.

AMD tiene fechada la primera GPU con esta característica para 2015, con la salida de Carrizo.

Ahora solo falta ver q las ALUs son diferentes para empezar a despertar la curiosidad de unos pocos.

Efectivamente tienen la mitad de hardware. ¿Por qué? Una explicación podría ser la latencia. Las GPUs actúales han tenido q tirar de memorias con una latencia altísima. Por lo q han tenido q buscar la manera de aumentar el tiempo de ejecución de los shaders para q no estén paradas esperando a la memoria. En el caso de One, gracias a la sram, esto no sería necesario.

Cuando veamos las nuevas GPUs con memorias stacked, igual empezamos a comprender algunas cosas.

P.d: Urian macho, la única GPU con 2 CP GFX es One.
Imagen

*Pasandoselo pipa leyendo debates tecnicos.

No era más sensato tener estos debates sanos desde el principio? Tenemos una arquitectura bastante curiosa, como la de xbox one. Exotica en algunas partes de su Arquitectura y sobre todo en los buses. Cualquier aficionado a la tecnología pienso que le encantaría saber exactamente como han llegado a esos 30 Gb/s, esa apuesta por lo eSRAM y los 2 CP entre otras cosas etc...
Pero desde el inicio se ha vilipendiado esa arquitectura y se le a tachado de error absoluto en el diseño. Ahora vemos que los juegos multi estan siendo cada vez más parejos y que la aquitectura es bastante eficiente.

Repito. No era más facil hablar de tú a tu y buscar info juntos, en vez de llegar al negacionismo mas irracional?

Yo aún entiendo que es dificil que haya memoria apilada (que en la NAND la hay, ojo...), y me cuesta creer que los datos que haya dado MS sean los de SP en vez de los de DP. Pero aún así, hay muchas preguntas que hacerse en el diseño, que están por resolver. Un saludo
isma82 escribió:[...]
http://developer.amd.com/wordpress/media/2013/06/2620_final.pdf
- Página 40: Multiple Concurrent Contexts Multiple ACE paths
Esta es la tercera vez que lo pongo macho... Una pista ¿Que crees que significa Concurrent? Concurrente es a la vez, Multiples contextos a la vez... vamos no se como quiere que te lo diga AMD. Mas claro es dificil.
[...]


si para ti, CONCURRENTES e INDEPENDIENTES significan lo mismo, obviamente, entenderas que Kaveri y Carrizo son identicos.

El problema es que la realidad es tozuda y las dos palabras son bastante diferentes.
Urian escribió:Ya no tenemos el IOMMUv2 de AMD en el caso de Xbox One, esta es la parte que han cambiado por completo y es hecha a medida. Por lo que no han tocado la GPU sino el mecanismo que comunica CPU y GPU.


¿Te han usurpado la cuenta o te ha ofrecido SonySpain un Invizimals?

En serio... ahora que hemos leido ese paper oficial, independientemente de si salió ayer o hace unos meses muchos lo hemos leido ahora, y confirman, por fin, algo que se ha negado hasta la saciedad como es la "doble GPU" (2 contextos completamente independientes).

¿Estamos locos o que? tanto que se ha criticado al Ruso y al Español y sus secuaces pero al final, lejos de quedarse sin credibilidad, ahora tienen más que nunca.

Ahora que vemos que la GPU es 6 + 6, completamente independientes, no el 14 + 4 de PS4 y muchas de las Modern Gpu. NO. Ahora que esta completamente confirmado, nos queréis hacer creer que M$ es tan subnormal de que tras hacer la arquitectura del futuro, va y monta 0,65TF para gráficos y 0,65TF para compute?????????????????????????????????????????????????????

Pues aunque existe esa posibilidad, ahora más que nunca, cobra mucha más fuerza lo del DoblePrecision, y que sean 1,31TF + 1,31TF... vamos, si no es que en M$ ya no es que sean subnormales, es que ya...

(INGENIERO)==> "oye lisensiado que tenemos una idea para el futuro, no va a valer para nada porque va estar super-desbalanceado pero mola"
(M$)==> "¿y en que consiste? Hablame de la computación"
(INGENIERO)==> "Pues vamos a liarla parda para conseguir tener una GPU 6gpu + 6gcpu, sera supergracioso!! [sonrisa], 2 módulos Jaguar + la mitad de la GPU + un Shape + 8GB DDR3 2100mhz + 4MB EDRAM entre los Jaguar + modificaciones para Virtualización "
(M$)==> "Ahh pues en proceso no va a ir nada mal, ¿qué me dices de los gráficos?"
(INGENIERO)==> "bu... bueno... es que para proceso gráfico sólo nos queda la mitad de la GPU, unos 650Gflops... y encima tendrían que alimentarse de la DDR3, y tú me dirás M$.. Entonces por que no añades más CU's?... no, tengo una idea mejor... ocupar ese espacio con 32MB más de EDRAM"
(M$)==> "Mmm no tiene ningún sentido, pero por eso mismo lo vamos a hacer... TOMA 3000 MILLONES Y LLAMA A AMD ahora mismo!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! venga! vamos a celebrarlo BIEENN XD XD XD XD XD XD "
Chifrinillo escribió:
Urian escribió:Ya no tenemos el IOMMUv2 de AMD en el caso de Xbox One, esta es la parte que han cambiado por completo y es hecha a medida. Por lo que no han tocado la GPU sino el mecanismo que comunica CPU y GPU.


¿Te han usurpado la cuenta o te ha ofrecido SonySpain un Invizimals?

En serio... ahora que hemos leido ese paper oficial, independientemente de si salió ayer o hace unos meses muchos lo hemos leido ahora, y confirman, por fin, algo que se ha negado hasta la saciedad como es la "doble GPU" (2 contextos completamente independientes).

¿Estamos locos o que? tanto que se ha criticado al Ruso y al Español y sus secuaces pero al final, lejos de quedarse sin credibilidad, ahora tienen más que nunca.

Ahora que vemos que la GPU es 6 + 6, completamente independientes, no el 14 + 4 de PS4 y muchas de las Modern Gpu. NO. Ahora que esta completamente confirmado, nos queréis hacer creer que M$ es tan subnormal de que tras hacer la arquitectura del futuro, va y monta 0,65TF para gráficos y 0,65TF para compute?????????????????????????????????????????????????????

Pues aunque existe esa posibilidad, ahora más que nunca, cobra mucha más fuerza lo del DoblePrecision, y que sean 1,31TF + 1,31TF... vamos, si no es que en M$ ya no es que sean subnormales, es que ya...

(INGENIERO)==> "oye lisensiado que tenemos una idea para el futuro, no va a valer para nada porque va estar super-desbalanceado pero mola"
(M$)==> "¿y en que consiste? Hablame de la computación"
(INGENIERO)==> "Pues vamos a liarla parda para conseguir tener una GPU 6gpu + 6gcpu, sera supergracioso!! [sonrisa], 2 módulos Jaguar + la mitad de la GPU + un Shape + 8GB DDR3 2100mhz + 4MB EDRAM entre los Jaguar + modificaciones para Virtualización "
(M$)==> "Ahh pues en proceso no va a ir nada mal, ¿qué me dices de los gráficos?"
(INGENIERO)==> "bu... bueno... es que para proceso gráfico sólo nos queda la mitad de la GPU, unos 65Gflops... y encima tendrían que alimentarse de la DDR3, y tú me dirás M$.. Entonces por que no añades más CU's?... no, tengo una idea mejor... ocupar ese espacio con 32MB más de EDRAM"
(M$)==> "Mmm no tiene ningún sentido, pero por eso mismo lo vamos a hacer... TOMA 3000 MILLONES Y LLAMA A AMD ahora mismo!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! venga! vamos a celebrarlo BIEENN XD XD XD XD XD XD "


Acaso lo dudas...? Para tareas gfx solo se dispone de 0,65TF [carcajad]
Horizonte de sucesos escribió:Acaso lo dudas...? Para tareas gfx solo se dispone de 0,65TF [carcajad]


No lo dudo, de hecho no me extrañaría que mañana ese sea el titular de los principales medios de este país...

Extra Extra!!!! Extraaa!!! Según documentos oficiales la GPU de la XboxOne es 0,65TF para gráficos!! Los otros 0,65TF eran para Kinect y ahora están desaprovechados!!!

Extra Extra!! M$ estaría pagando a Sony para que no saquen un emulador de XboxOne en PS4 que además suba los juegos a 1080p!!!!! [sonrisa] [sonrisa] [sonrisa] [sonrisa]
Urian está baneado del subforo por "Troll"
.
Editado por ahona. Razón: Spam
¿por qué no la escribes en este foro?
Editado por ahona. Razón: Quote
jajajja no voy a leer tanto porque está claro que la maquinaria anti One se ha activado en este hilo y no hay ganas de leer tonterias, pero... quién dice que sólo se usan 0.65TF para gráficos en One? Porque me meo eh me meo... Y de ser 0.65TF seran en DP lo cual son 1.31TF en SP... es que este dato no se porqué no se tiene en cuenta.
Chifrinillo escribió:
¿por qué no la escribes en este foro?


porque en este foro se la pueden rebatir y/o censurar de forma incomoda. en su blog no, ya que es el quien controla la conversacion.
Editado por ahona. Razón: Quote
Hookun escribió:Como?!! Hay 4 CPs : 2 para controlar los shaders(graficos) que son los graphics commands y 2 mas para controlar los compute commands dicese para los ACEs. Así que no tiene sentido alguno eso que me estas contando de hacer 6 gfx+6 DP porque es debido a la dualidad de los CPs y no tiene nada que ver. Seguimos insitiendo ahora en los motores de teselacion para explicar que haya mas de un CPs?!! Pero es que no te das cuenta de lo que dices no concuerda con nada porque todas GCN llevan dual motor geométrico o mas segun la GPU desde la serie 7790 en adelante?!? Por lo tanto todas deberian hacer eso. Te has parado a pensar por un momento que quizas eso es para sacar partido al DX12?!! Y estas dando palos de ciego?!!
Lo de las ALUS si se ven en las fotos así que es comprobable al 100% pero ya estamos como no lo digan en los papeles no vale. Lo de los tflops ya me lo se muy bien pero eso no es extrapolable a sacar la DP.Porque no se dan los datos de las GPUs en DP?!Pues como hasta ahora no era algo que le diera uso normal pues nunca las han dado.Pero para tu información la computación se usa en físicas ,iluminación,post procesados y Crytek en su cry engine nuevo usa la computación junto con la renderización basandose mucho en los compute shaders. Así que ya tienes una idea de porque usarlos. Despues de Quantun break vamos a ver motores que si les saquen partido.Pero bueno como se que me vas a seguir igual he decidido que abandono el post porque aquí hay poco que debatir y no no te doy la razón porque no la tienes ,ninguna explicacion es convincente ni tiene fundamento tecnico. Asi que animo campeón que te dejo para ti solo el post para que vayas dando clases a tus fieles seguidores.

Estabamos discutiendo sobre un articulo que supuestamente corroboraba la mayor parte de una teoría sobre que la gpu de xbox one es doble o dual o a la postre que es mucho más potente de lo que se suponía y ahora resulta que tu en tu búsqueda de la potencia oculta te inventas que esos datos son en Doble precisión por que tu lo vales sin aportar ninguna prueba de ello. Básicamente te lo inventas, pues muy bien. Yo tampoco voy a seguir discutiendo algo que no tiene ni pies ni cabeza. Me parece absurdo el debate de si es simple o doble precisión, absurdo, sin sentido y que no nos va a llevar a ningún lado y que no tiene fundamentos. Trae información de microsoft o de algun analista tecnico serio que lo diga y discutimos, pero mantener un debate sobre invenciones que ademas no tienen ninguna lógica y que se basan en humo pues no le veo el sentido la verdad. LAs fisicas en la computación, el direct compute y todo eso se hace en pc y en todas las plataformas DX 11 en adelante usando floads y no doubles entre otras cosas porque los doubles por definición son siempre mas costosos y porque realmente para un juego da igual la precisión decimal extra ya que no estamos haciendo simulación realista ni calculo cientifico.... es un videojuego y punto, donde cienes de veces la fisica se trampea o donde la iluminación se discretiza para que el tiempo de renderizado sea menor... Cuando estas discretizando para evitar tiempos de renderizado elevados y conseguir un framerate decente lo ultimo que te importa es si 0,0000023 realmente debería de ser 0,0000023199992 que es la diferencia entre usar un float y un double a parte de que los doubles ocupan el doble de memoria por lo que si ya la esram es pequeña almacenar todo en doble la dejaría en 16 MB equivalente.

Vamos que ni pies ni cabeza ni por donde cogerlo. En cuanto a los motores de geometría.... que no estoy diciend oque los motores de geometria sean los que permiten hacer esto. Estoy diciendo que la gpu esta diseñada para que se puedan dos operaciones de pintado concurrentemente porque hay dos colas de comandos de pintado, pero sobre el hadware que hay no multiplicando mágicamente como los panes y los pcs... PAra que me entiendas, se podrian renderizar en estereo para 3d de forma concurrente pero cada imagen renderizada usaria la mitad de la gpu.

@Chifrinillo en el paper no pone 12 + 12 ni 6+6 lo que deja claro es que tienes libertad para configurar la ejecución de la forma que quieras para minimizar los tiempos perdidos en la gpu de una forma diferente a como lo hace ps4. PS4 lo hace metiendo 6 aces cuando la configuracion de la gpu normal equivalete en pc es de 4. Y xbox one añadiendo un planificador de comandos graficos adicional customizado y aces más capaces y versátiles customizados. Lo otro es ciencia ficción y os lo sacais de la manga. Pero bueno es lo de siempre pero es que esto no es nuevo repito... que parece que algun ahora le ha llegado la iluminación divina...

http://www.eurogamer.net/articles/digitalfoundry-the-complete-xbox-one-interview

Digital Foundry: The GPU compute comparison seems to be about Xbox One's high coherent read bandwidth vs. raw ALU on PS4. But don't the additional ACEs added to PS4 aim to address that issue?

Andrew Goossen: The number of asynchronous compute queues provided by the ACEs doesn't affect the amount of bandwidth or number of effective FLOPs or any other performance metrics of the GPU. Rather, it dictates the number of simultaneous hardware "contexts" that the GPU's hardware scheduler can operate on any one time. You can think of these as analogous to CPU software threads - they are logical threads of execution that share the GPU hardware. Having more of them doesn't necessarily improve the actual throughput of the system - indeed, just like a program running on the CPU, too many concurrent threads can make aggregate effective performance worse due to thrashing.We believe that the 16 queues afforded by our two ACEs are quite sufficient.

PD2: seguis recurriendo a una imagen del chip que no tiene reflejo en el paper en nunguna parte ya que Microsoft ya ha dicho por activa y por pasiva que tiene 768 alus
http://www.slideshare.net/fullscreen/DevCentralAMD/inside-x-box-one-by-martin-fuller/4# transparencia 6.
Donde estan los que decian que ya sabian a ciencia cierta hasta el ultimo condensador de One?? Tachaban de locos a la mayoria que escribian aqui, segun ellos todo son gilipolleces...

La hoja de ruta sigue su curso [rtfm]
isma82 escribió:ahora resulta que tu en tu búsqueda de la potencia oculta te inventas que esos datos son en Doble precisión por que tu lo vales sin aportar ninguna prueba de ello.


1. No es lógico que al final tanto lio para 0,65TF.
2. Imagen

Sentido común (trabaja en paralelo con el sentido general :cool: ).
Urian está baneado del subforo por "Troll"
Los que hablan de 0.65 TFLOPS son gente de pocas luces que piensa que el números de procesadores de comandos multiplica o divide la potencia. Demostrando que no tienen ni idea de lo que hablan.
djber escribió:Donde estan los que decian que ya sabian a ciencia cierta hasta el ultimo condensador de One?? Tachaban de locos a la mayoria que escribian aqui, segun ellos todo son gilipolleces...

La hoja de ruta sigue su curso [rtfm]


Les tienes una pagina mas atrás, el mismo que decía que el HW de one no tenía secretos para el y ahí negando que la GPU tenga 2 contextos gráficos aunque sea informacion oficial de MS.

Y el resto pues ahi siguen defendiendo el 50% more power, bueno ahora 30% more power según fuentes desconocidas y misteriosas, y los resto de los astroturfer habituales andan callados.

Va a ver mas filtraciones, yo esperó que se hable de la memoria flash y el apilado en el sock, que hay va a ver miga, aunque sospecho que no va ser tan fácil que se filtre como esto.
Menudo deja vú con los shaders de la 360 y su directx9c. Pero si es exactamente la misma jugada! Calcada!
Urian está baneado del subforo por "Troll"
salocin21 escribió:
djber escribió:Donde estan los que decian que ya sabian a ciencia cierta hasta el ultimo condensador de One?? Tachaban de locos a la mayoria que escribian aqui, segun ellos todo son gilipolleces...

La hoja de ruta sigue su curso [rtfm]


Les tienes una pagina mas atrás, el mismo que decía que el HW de one no tenía secretos para el y ahí negando que la GPU tenga 2 contextos gráficos aunque sea informacion oficial de MS.

Y el resto pues ahi siguen defendiendo el 50% more power, bueno ahora 30% more power según fuentes desconocidas y misteriosas, y los resto de los astroturfer habituales andan callados.

Va a ver mas filtraciones, yo esperó que se hable de la memoria flash y el apilado en el sock, que hay va a ver miga, aunque sospecho que no va ser tan fácil que se filtre como esto.


¿Apilado en stock? [carcajad] [carcajad] [carcajad] [carcajad]
laleshe escribió:Menudo deja vú con los shaders de la 360 y su directx9c. Pero si es exactamente la misma jugada! Calcada!



Yo me acuerdo de eso mismo, por aquel entonces llegaba el super cell que se iba a merendar a la "básica" 360, la que resultó ser una loba con piel de cordero.

En este caso creo que más que una diferencia palpable en cuanto a términos gráficos, veremos una diferencia notable en eficiencia y, lo más importante para ms, le va a ganar una generación entera en cuanto a I+D, sony tendrá que tirar por este tipo de arquitectura en PS5 si no quiere quedarse muy atrás, es algo parecido a lo que ha pasado con el servicio online de microsoft, le saca una generación a ps y eso se nota.
La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.
Veo dificil que haya algún otro apilado en el soc. Pero aventurar 100% que no lo hay, tambien lo veo curioso, teniendo en cuenta el curriculum de MS y que ha estado trabajando en esa materia muchos años para las arquitecturas de sus Servers.
Urian está baneado del subforo por "Troll"
eloskuro escribió:La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.
Pero vaya, veo dificil que haya algún otro apilado en el soc


¿Sabes que la NAND Flash no es la RAM verdad? ¿Habéis leído algo de arquitectura de computadores? Yo lo dudo.
eloskuro escribió:La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.


No estoy 100% seguro pero no es stacked
Imagen

En teoría está al lado del South Brigde.
Urian escribió:
eloskuro escribió:La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.
Pero vaya, veo dificil que haya algún otro apilado en el soc


¿Sabes que la NAND Flash no es la RAM verdad? ¿Habéis leído algo de arquitectura de computadores? Yo lo dudo.


Obviamente. Solo digo que haber hay stacked. Pero a la vez te doy la razón, en que no creo que haya en la ram, ni en la gpu.
isma82 escribió:
Hookun escribió:Como?!! Hay 4 CPs : 2 para controlar los shaders(graficos) que son los graphics commands y 2 mas para controlar los compute commands dicese para los ACEs. Así que no tiene sentido alguno eso que me estas contando de hacer 6 gfx+6 DP porque es debido a la dualidad de los CPs y no tiene nada que ver. Seguimos insitiendo ahora en los motores de teselacion para explicar que haya mas de un CPs?!! Pero es que no te das cuenta de lo que dices no concuerda con nada porque todas GCN llevan dual motor geométrico o mas segun la GPU desde la serie 7790 en adelante?!? Por lo tanto todas deberian hacer eso. Te has parado a pensar por un momento que quizas eso es para sacar partido al DX12?!! Y estas dando palos de ciego?!!
Lo de las ALUS si se ven en las fotos así que es comprobable al 100% pero ya estamos como no lo digan en los papeles no vale. Lo de los tflops ya me lo se muy bien pero eso no es extrapolable a sacar la DP.Porque no se dan los datos de las GPUs en DP?!Pues como hasta ahora no era algo que le diera uso normal pues nunca las han dado.Pero para tu información la computación se usa en físicas ,iluminación,post procesados y Crytek en su cry engine nuevo usa la computación junto con la renderización basandose mucho en los compute shaders. Así que ya tienes una idea de porque usarlos. Despues de Quantun break vamos a ver motores que si les saquen partido.Pero bueno como se que me vas a seguir igual he decidido que abandono el post porque aquí hay poco que debatir y no no te doy la razón porque no la tienes ,ninguna explicacion es convincente ni tiene fundamento tecnico. Asi que animo campeón que te dejo para ti solo el post para que vayas dando clases a tus fieles seguidores.

Estabamos discutiendo sobre un articulo que supuestamente corroboraba la mayor parte de una teoría sobre que la gpu de xbox one es doble o dual o a la postre que es mucho más potente de lo que se suponía y ahora resulta que tu en tu búsqueda de la potencia oculta te inventas que esos datos son en Doble precisión por que tu lo vales sin aportar ninguna prueba de ello. Básicamente te lo inventas, pues muy bien. Yo tampoco voy a seguir discutiendo algo que no tiene ni pies ni cabeza. Me parece absurdo el debate de si es simple o doble precisión, absurdo, sin sentido y que no nos va a llevar a ningún lado y que no tiene fundamentos. Trae información de microsoft o de algun analista tecnico serio que lo diga y discutimos, pero mantener un debate sobre invenciones que ademas no tienen ninguna lógica y que se basan en humo pues no le veo el sentido la verdad. LAs fisicas en la computación, el direct compute y todo eso se hace en pc y en todas las plataformas DX 11 en adelante usando floads y no doubles entre otras cosas porque los doubles por definición son siempre mas costosos y porque realmente para un juego da igual la precisión decimal extra ya que no estamos haciendo simulación realista ni calculo cientifico.... es un videojuego y punto, donde cienes de veces la fisica se trampea o donde la iluminación se discretiza para que el tiempo de renderizado sea menor... Cuando estas discretizando para evitar tiempos de renderizado elevados y conseguir un framerate decente lo ultimo que te importa es si 0,0000023 realmente debería de ser 0,0000023199992 que es la diferencia entre usar un float y un double a parte de que los doubles ocupan el doble de memoria por lo que si ya la esram es pequeña almacenar todo en doble la dejaría en 16 MB equivalente.

Vamos que ni pies ni cabeza ni por donde cogerlo. En cuanto a los motores de geometría.... que no estoy diciend oque los motores de geometria sean los que permiten hacer esto. Estoy diciendo que la gpu esta diseñada para que se puedan dos operaciones de pintado concurrentemente porque hay dos colas de comandos de pintado, pero sobre el hadware que hay no multiplicando mágicamente como los panes y los pcs... PAra que me entiendas, se podrian renderizar en estereo para 3d de forma concurrente pero cada imagen renderizada usaria la mitad de la gpu.

Otra vez? No ves que hay datos técnicos ?! Mira ya es la ultima vez que te contesto.Porque directamente no valen las explicaciones que te podamos dar pero las tuyas tienen que ser las buenas y veo que tampoco tienes fundamentos técnicos para aseverarlo como haces. En fin...te lo vuelvo a decir ACEs no tiene nada que ver ni es lo mismo , pero tu erre que erre y ya no soy el unico que te lo dice pero podemos hacer el bucle hasta el infinito...Lo de DP ahora en serio coje las fotos de las ALUs y cuentalas.Sabes muy bien que la serie 7900 de AMD y Nvidia titan llevan configs diferentes de ALUs para poder trabajar en DP con mas potencia y si no deberías informarte por ahi. Si tienes el doble de ALUs que una GCN 1.1 no es una GNC 1.1 porque no existe esa configuracion en ella eso es asi de sencillo y no tiene ningun secreto. Voy a explicarlo sencillamente otra vez: Si hay 2 motores de teselacion en esas CUs significa que ambas dibujan por consiguiente trabajan como una sola GPU no es una GPU de 6 CUs y otra otra de Computación de 6 CUs. El porque 2 CP para graphics?! Pues no puedo asegurarlo con rotundidad pero bajo motores forwad + una GPU debe hacer 2 pases así que podría permitir un solo pase de "renderizado" con el consiguiente ahorro de recursos.Los otros 2 compute Commads son exclusivamente para ACEs,computación,DP...pero al haber comandos separados por hardware significa que la maquina puede hacer operaciones paralelas y simultaneas .No hay que esperar tiempos muertos como cuando tienes un único CP para poder hacer computacion.Así que es posible por hardware realizar 2 operaciones diferentes por ciclo tales como render y Computación a la vez. Quizas han optado por esta forma porque la esram estan rapida leyendo y escribiendo que pueden hacer que la GPU puede hacer varias tareas al no tener que llenar la lenta(en ciclos) GDDR5. Deja de pensar en la GCN porque desde el mismo momento que hay 4 CPs no puedes extrapolarlo a las arquitecturas actuales. Y ese es vuestro fallo que intentais explicarlo bajo una arquitectura que no es igual.Lo único que tienen parecido es que hacen 64 ops bajo single precission.Ahí se acabó cualquier parecido con la GCN 1.1
Urian escribió:
eloskuro escribió:La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.
Pero vaya, veo dificil que haya algún otro apilado en el soc


¿Sabes que la NAND Flash no es la RAM verdad? ¿Habéis leído algo de arquitectura de computadores? Yo lo dudo.

Pues claro que lo sabe, ¿pero qué tiene que ver si en ningún momento ha dicho que sea la RAM?. Estaba la duda de si tenía algo stacked y ha respondido.
Urian escribió:
eloskuro escribió:La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.
Pero vaya, veo dificil que haya algún otro apilado en el soc


¿Sabes que la NAND Flash no es la RAM verdad? ¿Habéis leído algo de arquitectura de computadores? Yo lo dudo.


si, algo hemos leido...

incluso hemos leido algo de que practicamente todas las NAND Flash llevan una CPU acoplada y que bajo determinadas condiciones, esta es programable y puede operar la memoria FLASH para operar como RAM.

http://www.bunniestudios.com/blog/?p=3554

ojo, que no estoy diciendo que XboxONE lleve esto (o al menos, no lo estoy diciendo TODAVIA), simplemente te estoy rebatiendo que ES POSIBLE usar memoria NAND Flash como RAM.
Urian está baneado del subforo por "Troll"
f5inet escribió:
Urian escribió:
eloskuro escribió:La SK Hynix H26M42003GMR 8 GB eMMC NAND Flash es stacked.
Pero vaya, veo dificil que haya algún otro apilado en el soc


¿Sabes que la NAND Flash no es la RAM verdad? ¿Habéis leído algo de arquitectura de computadores? Yo lo dudo.


si, algo hemos leido...

incluso hemos leido algo de que practicamente todas las NAND Flash llevan una CPU acoplada y que bajo determinadas condiciones, esta es programable y puede operar la memoria FLASH para operar como RAM.

http://www.bunniestudios.com/blog/?p=3554

ojo, que no estoy diciendo que XboxONE lleve esto (o al menos, no lo estoy diciendo TODAVIA), simplemente te estoy rebatiendo que ES POSIBLE usar memoria NAND Flash como RAM.


Lo que me estas describiendo es un microcontrolador, nada que ver con las consolas de videojuegos. ¿Has programado alguna vez un PIC?
Tampoco le hace falta, para saber que para una función específica podría apoyarse en este tipo de memoria. A ver si ahora resulta que para entender la función de una cosa hay que saber programarla.


Sí, pero no esta aplilada en el Soc, no? a eso me refiero
Hookun escribió: Voy a explicarlo sencillamente otra vez: Si hay 2 motores de teselacion en esas CUs significa que ambas dibujan por consiguiente trabajan como una sola GPU no es una GPU de 6 CUs y otra otra de Computación de 6 CUs. El porque 2 CP para graphics?! Pues no puedo asegurarlo con rotundidad pero bajo motores forwad + una GPU debe hacer 2 pases


Que no estoy diciendo que la mitad de la gpu sea para gpgpu.... que no que lo que estoy diciendo es que como tienes dos procesadores de comandos graficos y dos procesadores de comandos para gpgpu puedes configurar la gpu para que trabaje haciendo simultaneamente lo que quieras. Puedes operar con parte de la gpu en renderizado y parte en gpgpu o toda para una de las dos tareas no estrictamente que tenga 6 cus dedicados expresamente a la gpgpu todo lo contrario lo que pretenden es utilizar los timepos muertos para usarlo para gpgpu y permitir diferentes contextos de renderizado o diferentes contextos de computacion gpgpu. Lo de la doble precisión lo dejo estar piensa lo que te plazca pero es una completa estupidez que no tiene ni pies ni cabeza y te lo sacas de la manga.

Además como ejercicio sano revisa la cantidad de desmentidos de teorías locas como la de doble precisión que deja por lo sueles ese paper, te las detallo en el primer post... luego ya cada uno peude seguir multiplicando tflops como le salga del de ahí para configurar la enesima version inventada del hardware de Xbox one xD
Auto-borrado por Offtopic.
f5inet escribió:ojo, que no estoy diciendo que XboxONE lleve esto (o al menos, no lo estoy diciendo TODAVIA), simplemente te estoy rebatiendo que ES POSIBLE usar memoria NAND Flash como RAM.


Las Flash son NVRAM, por lo tanto, son RAM.

Otra cosa es poder usarlos como memoria para acumular los datos para poder computarlos. En eso los NAND no son precisamente la mejor eleccion.

Y otra cosa distinta seria usarlo de cache a un nivel alto. En eso, supondra mejorar frente a cualquier memoria mas lenta que ella, como por ejemplo el disco de 5400rpm que monta la consola.

Eso si es un uso viable (si no se esta usando la NAND para nada mas en ese momento) y eficiente.
Buenas gente. De verdad sigo sin explicarme el porqué de tanto revuelo, es q estoy flipando en serio [carcajad] [carcajad] [carcajad] . Cuantas veces se ha hablado aquí de los 2 command proccessors para gráficos?. Esto parece q es ciclíco. Podríais decirme la diferencia entre la entrevista de los arquitectos de XboxOne en DF y la conferencia HotChip, y esto "nuevo"?. Lo mejor de todo es q no ha cambiado nada desde lo q sabíamos entonces pq no se ha desvelado nada nuevo, se dice exactamente lo mismo.

Por otro lado, estáis confundiendo muchas cosas con respecto a cómo funciona una GPU. Yo me lo estoy pasando pipa leyéndoos [sonrisa] [sonrisa] [sonrisa] .

Un saludo.
17587 respuestas