Nowcry escribió:Blackhand15 escribió:Nowcry escribió:
Si que tiene muy buena pinta, creo que SX podrá sacarle mas rentabilidad que PS5.
He estado mirando videos de hardware que no puedo postear aquí porque son comparativos, habla de hardware y de una característica esencial de hardware grafico. En este hablaba que un dato muy importante es la cache L1 y como y con cuantas se comparte. Dice que ese es tan esencial que explica en su mayor parte lo bien que funciona PS5. Sin embargo a falta de ver como funciona Fidelity pero si es parecido a nvidia pero sin hardware dedicado, necesita poca VRAM y poco movimiento de texturas, son operaciones matemáticas siguiendo una matriz.
Por lo que veo bastante factible que una GPU que tiene las L1 saturadas sea capaz de usar los shaders que se encuentran en espera. PS5 cuyo índice de Shaders en uso es bastante mas alto sea mas difícil sacarle rentabilidad. Pero yo creo que obtendremos mejora porque hay juegos con menos optimización que seguramente mejore su rendimiento y también siempre hay margen para usar shaders por lo que en cualquier caso ayudara a poder sacarle mas partido al hardware. Ese % de CU en espera pueden calcular la IA para rellenar FIdelityFX, quien sabe quizá la PS5 consiga usarse mejor por los clocks o por el software.
Me interesa saber si no es molestia saber por que ps5 usa shaders en uso mas alto etc y si ves que vas a entrar en comparativas si puedes me envias un mp ya se que da pereza pero yo que se por si te animas y te lo agradeceria
Voy a intentar decirlo sin entrar en comparativas, pero la PS5 tiene 36 CU divididas en 4 shaders engine (SE) 9CU por SE. Cada Shader Engine tiene una caché L1 de X tamaño y con X ancho de banda por clock.
Generalmente los shaders piden texturas que es lo más pesado a las caches y producen dependiendo de la operación 10 ciclos de espera hasta que la consiguen. Si en L1 no está se pregunta a L2 y si en L2 no está se pide a GDDR y si aquí tampoco al SSD. Si pides a L1 la info tardas 10 clocks de espera (dato inventado depende de la textura tamaño etc) hasta que la consigues completa, si saltas a L2 (porque L1 no la tiene) ya son 100 clocks de espera, si saltas a GDDR ya son 1000 clocks de espera y si GDDR no la tiene ya son 10.000 clocks de espera para el SSD.
Que tiene la PS5? Menos shaders por L1 compartiendo siendo las L1 iguales y a su vez la PS5 tiene mayor frecuencia lo que aumenta los anchos de banda de las caches. Por lo que si menos Shaders preguntar a las mismas cachés que a su vez tienen más anchos de banda, es lógico pensar que es más probable que las caches no estén saturadas.
Además la PS5 cuenta con 2 cores que haces de IO controller y se dedican a monitorizar de forma automática lo que hay en las caché y borrar solo las partes que no se van a usar en lugar de resetear caches enteras. También el IO controller se dedica a meter cosas en la GDDR antes de que un shader haga las peticiones que ayudado por un SSD con varios carriles de preferencia hace que si por algún casual no haces HIT en las caché se tarden menos clocks en obtener la información. Todas estas soluciones están basadas en hardware el IO controller el SSD diferente lo diferentes carriles de prioridad el sistema de las caches son hardware fabricado así no se puede emular igual de rápido y bien por software usando CPU.
Por lo que te he contado puedo asegurar que un juego bajo las mismas horas hombre de trabajo y de programación en ambas versiones. La versión de PS5 tiene mayor utilización de los shaders, ya que el hardware que pensó Sony está ideado para evitar los tiempos de espera lo máximo posible con tecnología de 400-500 euros.
Una gran paralelizacion de los shaders es decir muchos shaders Engine necesita una gran división con muchas caches y un buen programador de tareas cada vez más complejo. No se puede paralelizar mucho y meter muchos shaders en la misma caché o se quedarán en espera por falta de ancho de banda.
Sin embargo una GPU más pequeña con mayor número de clocks no necesita más caches ya que el ancho de banda de las caches aumenta con la frecuencia, eso sí las caches van perdiendo efectividad según elevas las frecuencias, hasta un punto que cometen fallos en los datos trasmitidos. Es decir subir la frecuencia se puede pero no infinitamente.
Lo mejor es conseguir el término medio frecuencia alta y una paralelizacion equilibrada. Por ejemplo Nvidia tiene 6 SE por L1, y la RTX 3090 es capaz de subir hasta los 2100 MHz. Siendo una GPU con 82CU.