A NVIDIA se le están yendo de las manos los errores en sus drivers?

Explico un poco mi caso. Por mediados del año pasado, me vi obligado a actualizar los drivers de Nvidia (tengo una Asus Strix 3090 OC), porque eran un requisito obligatorio para el uso de software del trabajo.

Semanas más tarde, empezó a darme problemas, con VIDEO_TDR_FAILURE (116), DPC_WATCHDOG_VIOLATION (133), nvlddmkm.sys y errores similares. Lo primero que pensé es que la gráfica estaba muriendo, pero lo curioso es que pasaba test de rendimiento, juegos durante bastantes horas y en tareas pesadas con programas del trabajo (renders 3D, renders de vídeo, modelados 3D con alta carga poligonal, etc) la GPU iba como un tiro, sin artefactos ni nada por el estilo y temperaturas muy buenas (voy con liquida custom).

Los errores pasaban sobre todo al cerrar una tarea pesada y tener de fondo otra tarea liviana, como un navegador (uso Chrome) con un video o stream de fondo. Cerraba el programa y al minuto o varios minutos pantallazo negro, azul o cuelgue.

Pensé que era un tema de memoria RAM, ya que las tengo muy estrujadas (128 GB a 3600 con latencias bajas en una plataforma AM4 x570 con un Ryzen 5950x) del Resizable BAR o incluso de la placa base, ya que estaba en una version antigua de la BIOS de 2021 (una Asus Dark Hero x570) y ya estaba teniendo el famoso problema del TPM, que de forma aleatoria el ordenador pegaba un minicuelgue que se recuperaba en 1 segundo.

Finalmente en mis vacaciones me puse a investigar y intentar arreglar el problema. Primero actualizando a windows 11, para ver si era un tema de drivers del chipset x570 y del S.O., seguidamente probando diferentes versiones de drivers de nvidia, actualizando la BIOS a la última version, modificando DPC, registros de windows, desactivando servicios, etc. Vamos, hice de todo.

Total, que despues de descuartizar drivers, hardware y S.O., me di cuenta que instalando los drivers "Game Studio" o poniendo el uso de energía en Máximo rendimiento en el panel de nvidia, este error desaparecía, no solo desaparecía sino en algunos casos como que ganaba fluidez y en los test de rendimiento no perdía rendimiento alguno.

Por lo que la conclusión es que este error pasaba cuando había un cambio brusco de frecuencias usando los drivers "Game Ready", seguramente es una mala gestión de energía entre la frecuencia/voltaje provocado por los drivers de nvidia.

Todo esto lo consideraría un caso aislado de mi GPU si no fuera porque en mi búsqueda para solucionar estos errores, he visto mucha gente en diferentes foros en el ultimo año con problemas similares o peores y con otros diferentes como que al actualizar los drivers, los monitores secundarios no encendían, latencias excesivamente altas (comprobandolo con LatencyMon) aun modificando el msi de los drivers en high y otras modificaciones como desinstalar los drivers de audio o desactivar el hardware de audio de nvidia, etc.

Por lo que parece que los drivers de Nvidia cada vez van a peor con mayores problemas y errores.

Alguien más ha tenido problemas similares?
No tengo muy claro que sea un caso aislado:

Video TDR Failure BSOD, nvlddmkm.sys

Nvlddmkm 4090 Crash solved

DPC Watchdog Violation BSOD

Pongo los de reddit que son los que tengo más a mano, pero en foros de ASUS, MSI incluso en foros de Microsoft hay bastantes users con estos problemas y con lo que no se encienden las pantallas secundarias.

En la mayoría de los casos se soluciona con lo del power manage y modificando el MSI en hight, en otro simplemente es que la grafica ha hecho chof, pero en los casos de "Video TDR Failure" y "DPC Watchdog Violation" en el ultimo año suelen ser cosa de los drivers.
2 respuestas