Nowcry escribió:https://www.neogaf.com/threads/next-gen-ps5-xsx-ot-speculation-analysis-leaks-thread.1480978/post-261589159Un post muy completo que vale la pena repostearlo aún así RECOMIENDO LEER EL ORIGINAL PORQUE TIENE ENLAZADAS TODAS LAS FUENTES. Es un post de alguien que creo que ha podido trabajar en ese proyecto pero no puedo asegurarlo.
Reposteo traducido:
El número de ACE / colas de cómputo en una GPU no tiene nada que ver con el administrador de tareas SPU (STM). Según Cerny, tiene mucho que ver con la cantidad de cómputo asíncrono que un proveedor (o cliente en el caso de SIE) quiere que haga una GPU en particular para los sistemas de juego (sistemas de juegos de PS) y middleware (middleware de PS):
"Para PS4, he trabajado con AMD para aumentar el límite a 64 fuentes de comandos de cómputo - "... " La razón por la que se necesitan tantas fuentes de trabajo de cómputo es que no son solo los sistemas de juego los que usarán cómputo - el middleware lo hará también necesitan computación ". - Mark Cerny
Lo que Volcanic Islands puede hacer es programar tareas y ponerlas en la misma cantidad de colas de cómputo que tiene la GPU de PS4. Lo que no puede hacer (y todas las demás GPU de PC) es usarlos de la manera más eficiente que puede hacer la GPU de PS4. Ahí es donde entran en juego las personalizaciones derivadas de STM para el caché y el bus (reduce la sobrecarga asociada con el cambio de contexto) de la GPU de PS4. El 'bit volátil' en el artículo que vinculó se basa en estas personalizaciones derivadas de STM para efectuar una imitación de SPURS en la GPU. Como dijo Cerny:
" Primero, agregamos otro bus a la GPU que le permite leer directamente desde la memoria del sistema o escribir directamente en la memoria del sistema , sin pasar por sus propios cachés L1 y L2". - Mark Cerny
" Siguiente,simultáneamente para el procesamiento de gráficos y el cómputo asincrónico, hemos agregado un poco en las etiquetas de las líneas de caché, lo llamamos el bit 'volátil'. "..." - en otras palabras, reduce radicalmente la sobrecarga de ejecutar cómputo y gráficos juntos en la GPU. "- Mark Cerny
"Estamos tratando de replicar el SPU Runtime System (SPURS) de la PS3 personalizando en gran medida el caché y el bus ", - Mark Cerny
Una de las personas que trabajó en Volcanic Islands no tenía idea de qué ' bit volátil 'fue hasta que Cerny lo mencionó:
" Trabajé en modificaciones a los bloques de gráficos centrales. Entonces, se implementaron funciones debido a los clientes de la consola. Algunos vivirán en productos para PC, otros no. Al menos un cambio fue muy invasivo, algunos moderadamente. Esto es todo lo que puedo decir. Ya que Cerny lo mencionó, comentaré sobre la bandera volátil. No lo supe hasta que lo mencionó, pero lo busqué y realmente es nuevo y está impulsado por Sony . Los ACE extendidos son una de las características personalizadas a las que me refiero ". AMDer anónimo
Sin personalizaciones derivadas de STM y el 'bit volátil', una GPU AMD para PC tiene una mayor sobrecarga de cambio de contexto. El aumento de los recuentos de colas de cálculo / ACE no cambiará eso. Con las personalizaciones derivadas de STM y el 'bit volátil', una GPU AMD se convierte en algo parecido al sistema de renderizado híbrido SPU + GPU impulsado por SPURS de PS3 con una sobrecarga de cambio de contexto "radicalmente" reducida, independientemente de cuántas ACE / colas de cómputo tenga.
Las entradas [0012] y [0013] de la patente que vinculó explican que SPURS es un tipo de sistema de tareas SPU; y esta patente acredita a Keisuke Inoue, Tatsuya Iwamoto y Masahiro Yasue con su invención. En CELL, el administrador de tareas SPU es un componente de software de SPURS que reduce la sobrecarga de cambio de contexto dentro del software SPURS.
Los coprocesadores de E / S, el motor de descompresión, los motores de coherencia y DMAC del complejo de E / S equivalen a lo que es básicamente una CELL de imitación diseñada para hacer en hardware lo que hicieron las SPU en software, ya que según IBM CELL es similar a un procesador de E / S (PIO) ...
Las diferencias son que tiene una CPU integrada (PPE basado en PowerPC) y no se limita solo a dirigir entradas / salidas, ya que una o más de sus SPEs (como IOP en su capacidad para aliviar el PPE de E / S deberes) se pueden dividir en grupos y asignar tareas específicas si es necesario. Una CÉLULA con una cantidad suficiente de PPE y SPE podría reemplazar todo el hardware especializado dentro del complejo IO de PS5 ..
- Las SPU se extienden al canal de sombreado de GPU y mantienen la coherencia con la GPU a la que asisten a través de las técnicas de sincronización de SPU <-> GPU
; como mencionó, las SPU realizan la descompresión (también se ve en la diapositiva de CELL anterior)
- cada SPE tiene su propio DMAC para transferir Entrada / salida de datos de la memoria y el almacenamiento del sistema
: las SPEs manejan la asignación de memoria y la E / S de archivos (manejada por los dos coprocesadores de E / S de PS5)
Sí, la opinión popular es que usar CELL para PS3 fue un "error" que resultó en el peor problema financiero de Sony. fracaso y pérdida de cuota de mercado; pero en mi opinión, el éxito de PS4 / pro y PS5 se puede atribuir directa y en gran medida a la naturaleza orientada al futuro de CELL / PS3. En 2007Se informó que Ken Kutaragi vio las pérdidas de PS3 como inversiones .
Para mí es evidente que el "ROI" de PS3 (en lo que se refiere estrictamente a los juegos) se ha obtenido principalmente en forma de conocimiento que se ha utilizado en dos generaciones para reforzar APU escuálidas. La experiencia previa en el diseño de arquitectura de sistemas heterogéneos para PS3 y el trasplante de computación asincrónica similar a CELL a la GPU les puso algo de carne. Las técnicas de software utilizadas para mejorar la calidad de imagen de los juegos de PS3 se desarrollaron para darle a la APU personalizada cierta definición muscular.
Uno de los mejores ejemplos pasados de esto es el búfer de identificación basado en hardware de PS4 Pro (probablemente emulado por el motor de geometría de PS5) utilizado para la representación de tablero de ajedrez. Sus orígenes se remontan a la implementación SPU MLAA basada en software de PS3, que utilizaba ID de objeto, información de color y división horizontal para detectar y suavizar los bordes con alias de los objetos en las escenas ...
- descripción general rápida de SPU MLAA
- por qué es necesaria la detección de bordes
- MLAA horizontal con división ilustrada en un patrón de tablero de ajedrez
- Captura de MLAA horizontal con división en KZ3
- Proceso de ID de objetos e información de color para detección de bordes en SOCOM
- Cubierta para la plataforma de diapositivas de representación de tablero de ajedrez de Frosbite Labs
- el historial de la representación de tablero de ajedrez arraigado en las ID de objetos SOCOM para la detección de bordes MLAA
- el historial continuó en el hardware de búfer de ID de PS4 pro y el soporte de Frostbite Labs
En la explicación de Cerny del búfer de ID de PS4 pro, dijo:
" Como resultado del búfer de ID ahora puede saber dónde están los bordes de los objetos y los triángulos y seguirlos de un cuadro a otro , porque puede usar el mismo ID de un cuadro a otro, "..." Y voy a explicar dos técnicas diferentes que usan el búfer : uno más simple que es la representación geométrica y otro más complejo, el tablero de ajedrez. "..."En segundo lugar, podemos usar los colores y los ID del fotograma anterior, lo que quiere decir que podemos hacer un anti-aliasing temporal bastante bueno. "- Mark Cerny
En mi opinión, sus sentimientos están justificados y las inversiones (o pérdidas si lo prefiere) vinculadas a la I + D de PS3 en general, la I + D de CELL específicamente ha estado pagando dividendos de diferentes maneras durante mucho tiempo.
Todo esto tiene mucho que ver también con atomview y su tecnología:
https://www.reddit.com/r/PS5/comments/g ... =post_bodyAquí podéis ver de su tecnología y como hacer 4 polígonos por pixel parece ir más suaves en la GPU que polígonos más grandes, en detrimento de un IO controller más potente.