josele69 escribió:There's also bug in his benchmark involving CUDA where the last 500MB isn't actually VRAM bandwidth but is actually limited by PCI-E because for some reason the memory allocation is experiencing tons of page faults. This means that the benchmark is actually swapping out to system RAM for the last 500MB.
Puede ser que el uso de esos 0.5 gb sea asignado por el controlador bajo ciertas condiciones, y el test ese no las cumpla.
No se, es todo muy raro xD
Ya lo he explicado en los hilos pertinentes, sí se usa esa VRAM, apenas hay diferencia en usarla, sólo baja un porcentaje muy bajo el rendimiento, pero si no es necesario usar la VRAM por encima de 3,5 GB, evita usarla por eso, porque más vale rendimiento en mano que medidor de afterburner "pajeando" con la memoria.
La aplicación intenta a lo bruto asignar tanta VRAM como tenga la gráfica (menos los últimos 128 MB), pero no lo consigue en varias condiciones (entre otras, si usas Aero la memoria que use el escritorio), cuando no lo consigue, gracias a la forma en que funciona CUDA, el programa funciona igual pero usando la RAM del sistema (simulación de memoria unificada, a lo bruto by CUDA), y de pronto se ve el resultado de acceder a un área de memoria que realmente no está en la VRAM, sino en la RAM y cargada por pci-e. Que por cierto, el test me ha reseteado porque sí alguna vez el driver gráfico (aunque sin dramatismos perceptibles en el escritorio, sí un cuadro de aviso cuando ocurre), además de cerrarse de mala manera alguna que otra vez. Con una GTX 770, y con los últimos bloques de datos funcionando también muy lento por lo dicho (Aero y memoria que no puede conseguir la app y que es "emulada" con RAM principal).
Si el programa está renderizando una imagen y necesita más de 3,5 GB de datos reales para renderizar la imagen, es cuando sí que usará toda la VRAM, como demuestra los casos y efectos en rendimiento que han mencionado nvidia y han corroborado los sites que han hecho el seguimiento del "problema".
El problema se llama pérdida de un 2% de rendimiento si se usan casi completos o completos los 4 GB, ni más ni menos. Ah, y por supuesto, el afterburner mostrará usos de memoria distintos en una GTX 980, porque a ésta le da igual usar la memoria sobrante cerca de los 4GB para cachear datos "por si acaba necesitándolos", ya que no tiene efecto adverso alguno, ni pequeño ni mínimo. En la GTX 970, sólo cuando haga falta de verdad, no para cachear datos.