Letrina escribió:https://youtu.be/nr6iVV-kUvs
1horita de analisis de Hardware 360 muy interesante, estaba esperando este analisis hace semanas, voy a verlo!
Hay un momento en el vídeo este, en el que menciona lo bien que funciona el luxmark ahora y que él se supone que tendrá que ver con que ahora el driver opencl aprovecha los rt cores, que me ha dejado con mas preguntas que otra cosa. Ayer según veía el vídeo cuando llegué a ese momento, lo puse en pausa, me instalé el luxmark y le pasé los tres renders que hace. Efectivamente, el rendimiento de renderizado ahí es soberbio, podría de hecho haber subido los resultados a la web de resultados que hay y en los 3 casos habría entrado en el top20, pero me dejó con la duda de si realmente todo eso se debe al uso de los núcleos rt, aprovechados por el driver opencl, o si la mejora de los cuda cores con respecto a las maxwell y pascal es la que obra el milagro, o si incluso todo eso tiene que ver con que aprovecha los tensor cores, o las tres cosas. Recordemos que ahora los cuda cores tienen unidades de proceso de números enteros que antes no existían, aunque claro, por otro lado que esto ahora procese números enteros de forma concurrente no debería tener nada que ver con un renderizador, donde lo que importa es lo rápido que procese en coma flotante. He estado buscando un buen rato por ahí a ver si conseguía leer algo que me aclarara todo este tema, alguien de nvidia que explique que circuitos están funcionando ahí, si con el driver opencl se puede usar absolutamente toda la circuitería o todavía quedan cosas pendientes ahí. No he conseguido averiguar nada.
Al chaval del vídeo se le ve puesto en el tema, lo que dice podrá molestar mas o menos o tener mas o menos razón en sus teorías, pero está claro que para preparar el vídeo ha necesitado un montón de horas de testeo. Espero que pueda ganarse bien la vida con eso.
P.D. Sobre esto, algo puede que haya averiguado, aunque no mucho. Al ver los resultados de luxmark sobre una titan v, con chip volta, que tiene tensor cores pero carece de rt cores, supongo que en este caso mas que los rt cores, tendrán mas que ver que el driver opencl eche a andar los tensor que a fin de cuentas son fpus. Aún así no puedo decirlo seguro del todo, porque todavía no he encontrado el sitio que lo diga explícitamente.