Existe alguna herramienta para detectar posibles fallos en la GPU??

Pues lo del título, mas allá del típico estrés de uso y temperaturas como Furmark y benchs, me gustaría saber si existe alguna herramienta que detecte errores en la memoria por ejemplo o cosas así.

Lo pregunto porque mi PC a veces no arranca (pero si enciende) no dando señal de video y la placa base me "chiva" por un LED de indicación de errores que es la VGA. Normalmente si quito todos los conectores externos, abro la torre, cambio los cables de 8 pines y desmonto/monto la gráfica por arte de magia arranca :-? Esto ya me ha pasado varias veces y en todas hasta que no hago ese ritual no arranca. Lo extraño esque jugando no he visto comportamientos raros, ni stutters, ni artefactos visuales, ni bajo rendimiento ni nada que me indique que está muriendo... Sólo una vez hace un par de días mientras jugaba se me apagó la pantalla con el sonido de fondo del juego y al reiniciar vuelta a lo mismo, no arrancaba hasta que hice "el ritual".
@garbaje_de_potanzos


¿Fuente de alimentación?

Para las memorias puedes echarle un vistazo a un vídeo de Sfdx Show donde explica el funcionamiento de MATS/MODS. [beer]
lerelerele escribió:@garbaje_de_potanzos


¿Fuente de alimentación?

Para las memorias puedes echarle un vistazo a un vídeo de Sfdx Show donde explica el funcionamiento de MATS/MODS. [beer]


Sobre la fuente pues podría ser, aunque es "nueva" ya que no tiene ni un año. Tengo por ahí una fuente con 16 años a sus espaldas pero se que funciona y podría probar a ver, pero como esto no es reproducible si no algo mas bien aleatorio, que ocurre con poca frecuencia y que encima se soluciona cuando quito/pongo el cableado pues no se como podría comprobar si es la fuente la verdad xD

Me veré ese video a ver si rasco algo, gracias!

Edito.- Pues pasándole el MATS ese me ha dado FAIL y esque en el último módulo (D1) me ha encontrado 33 errores de escritura. El caso esque en el vídeo le detecta varios millones de errores, por lo que no se si debería preocuparme xD
garbaje_de_potanzos escribió:Edito.- Pues pasándole el MATS ese me ha dado FAIL y esque en el último módulo (D1) me ha encontrado 33 errores de escritura. El caso esque en el vídeo le detecta varios millones de errores, por lo que no se si debería preocuparme xD

Cualquier número de errores que no sea 0 es para preocuparse en este caso en particular. Lo que me sorprende sobremanera es que en ese caso no salgan artifacts de forma frecuente o directamente se cuelgue.

La parte "buena" es que eso descarta casi con toda probabilidad un fallo de la fuente. Pero vamos, que si es nueva y regulera, tampoco te fíes mucho de eso.

Saludos
Pollonidas escribió:
garbaje_de_potanzos escribió:Edito.- Pues pasándole el MATS ese me ha dado FAIL y esque en el último módulo (D1) me ha encontrado 33 errores de escritura. El caso esque en el vídeo le detecta varios millones de errores, por lo que no se si debería preocuparme xD

Cualquier número de errores que no sea 0 es para preocuparse en este caso en particular. Lo que me sorprende sobremanera es que en ese caso no salgan artifacts de forma frecuente o directamente se cuelgue.

La parte "buena" es que eso descarta casi con toda probabilidad un fallo de la fuente. Pero vamos, que si es nueva y regulera, tampoco te fíes mucho de eso.

Saludos


Investigando un pelín por lo visto el reporte de exactamente 33 errores del test se debe a un fallo en el programa y se puede ignorar. Sacado del último comentario del Admin de esta web sobre reparaciones de gráficas https://rupz.me/graphics-card-repair/zo ... -1060-6gb/


Pero claro luego te ves la continuación de vídeo del que me ha puesto @lerelerele y tiene una 1060 con exactamente 33 errores de escritura en un módulo pero con artifacts visibles y mal funcionamiento que soluciona con re-ball... Pero en el caso de sdfx él vive de crear contenido en youtube y supongo que cualquier excusa es buena para sacar un nuevo video xD

El video en cuestión, a partir del minuto 10:05


PD.- Investigo un poco más y veo que en la página de reparaciones anterior, el usuario al que el Admin responde es el propio SDFX, puesto que la fecha de su post es aproximada a la del vídeo, comenta el mismo fallo exacto que tiene en su 1060 con los 33 errores que muestra en el vídeo y postea que tras el re-ball (que le hizo en el vídeo y dio por arreglada) sólo le funciona para tareas de escritorio y no para renderizado.
@garbaje_de_potanzos Yo la única fuente que veo sobre lo de que exactamente 33 errores indica un fallo del programa es justamente el comentario al que haces referencia, no veo ningún otro post ni vídeo de gente del gremio ni lo había oído nunca.

Y vaya, en tu caso podría ser ya que no tiene artifacts ni cuelgues, en el suyo desde luego que no dado que no funciona con carga según dice en el comentario, ahí es evidente que esos 33 fallos son de verdad. Hay veces en los que un reflow arregla fallos del estilo pero solo de forma temporal, que tiene pinta de ser lo que le pasó con la gráfica del vídeo. 11k fallos los da si el chip está para tirar, 33 puede ser que solo alguna de las líneas de datos esté chunga, o una soldadura contada que se haya roto.

Saludos
Pollonidas escribió:@garbaje_de_potanzos Yo la única fuente que veo sobre lo de que exactamente 33 errores indica un fallo del programa es justamente el comentario al que haces referencia, no veo ningún otro post ni vídeo de gente del gremio ni lo había oído nunca.

Y vaya, en tu caso podría ser ya que no tiene artifacts ni cuelgues, en el suyo desde luego que no dado que no funciona con carga según dice en el comentario, ahí es evidente que esos 33 fallos son de verdad. Hay veces en los que un reflow arregla fallos del estilo pero solo de forma temporal, que tiene pinta de ser lo que le pasó con la gráfica del vídeo. 11k fallos los da si el chip está para tirar, 33 puede ser que solo alguna de las líneas de datos esté chunga, o una soldadura contada que se haya roto.

Saludos


La verdad esque me quedo un poco igual queal principio, puede ser que la gráfica sea el fallo pero puede ser que no xD Por un lado me facilitaís herramientas de diagnóstico la cual me reporta fallo, pero por otro lado veo que donde SDFX participa le indican que es un falso/positivo del software. Por hacer alguna prueba mas mundana he dejado corriendo el MSI Kombustor una hora y pico y nada raro cada vez que lo he mirado, ni artifacts, ni temperaturas anormales ni cuelgues...

Igual se me ocurre dejar el PC alimentado con la fuente vetusta que tengo ahí durante unos días y ver si ocurre de nuevo esto de que no arranque o que pierda la señal de vídeo mientras juego a algo para ver si la culpable es la fuente, que es esta comprada nueva hace 10 meses https://www.pccomponentes.com/evga-700- ... mi-modular
lo mas facil probar en otro equipo , si tienes otra fuente probar con ella
Prueba a poner desde la bios la velocidad del pcie manualmente x8/x8 en vez de en auto a ver si se soluciona.

Te lo digo porque a mi, en una placa que tuve, me pasaba algo parecido. En mi caso nunca me detectaba la gráfica en ese pcie en concreto y tenía que configurarlo manualmente.
Si medio sospechas de la VRAM, bajale la velocidad, deja que Afterburner aplica siempre ese UC al iniciar Windows, si pasa el tiempo y no te falla, algun modulo esta un pelin tocado, pero con bajar la velocidad te quitas el problema, si esta muy machacado (viendo el reporte de fallos no lo parece) te acabara bloqueando todo otra vez.

Despues de eso, solo te queda probar otra fuente.

Con eso te deberia asomar el problema si o si😉

Es mas, si quieres salir de dudas mas rapido, haz OC en la VRAM, si esta mal, el problema en lugar de salir cada cierto tiempo, saldra mas a menudo.....
ivan95 escribió:Si medio sospechas de la VRAM, bajale la velocidad, deja que Afterburner aplica siempre ese UC al iniciar Windows, si pasa el tiempo y no te falla, algun modulo esta un pelin tocado, pero con bajar la velocidad te quitas el problema, si esta muy machacado (viendo el reporte de fallos no lo parece) te acabara bloqueando todo otra vez.

Despues de eso, solo te queda probar otra fuente.

Con eso te deberia asomar el problema si o si😉

Es mas, si quieres salir de dudas mas rapido, haz OC en la VRAM, si esta mal, el problema en lugar de salir cada cierto tiempo, saldra mas a menudo.....

En los momentos que dice que no le enciende el PC no va a cambiar nada, porque en el POST el sistema operativo y el MSI afterburner están muy lejos de modificar en cualquier aspecto al situación, con la frecuencia de RAM o como sea.

Yo he tenido casos con relativamente pocos errores que no llegaban siquiera a instalar el driver con el famoso error 43, salían artifacts y crasheaba si lo intentaba. Si los fallos están en una región "lejana" de la RAM, que el sistema operativo no necesita para inicializar la GPU, probablemente funcione con artifacts, pero dudo mucho que bajando la frecuencia se arregle. Subiendo la frecuencia puede que vaya a peor como dices pero... ¿cómo sabes si es el fallo de RAM que ha ido a peor o un OC inestable? Yo pienso que hacer las pruebas que comentas aporta muy poca información.

Saludos
garbaje_de_potanzos escribió:Pues lo del título, mas allá del típico estrés de uso y temperaturas como Furmark y benchs, me gustaría saber si existe alguna herramienta que detecte errores en la memoria por ejemplo o cosas así.

Lo pregunto porque mi PC a veces no arranca (pero si enciende) no dando señal de video y la placa base me "chiva" por un LED de indicación de errores que es la VGA. Normalmente si quito todos los conectores externos, abro la torre, cambio los cables de 8 pines y desmonto/monto la gráfica por arte de magia arranca :-? Esto ya me ha pasado varias veces y en todas hasta que no hago ese ritual no arranca. Lo extraño esque jugando no he visto comportamientos raros, ni stutters, ni artefactos visuales, ni bajo rendimiento ni nada que me indique que está muriendo... Sólo una vez hace un par de días mientras jugaba se me apagó la pantalla con el sonido de fondo del juego y al reiniciar vuelta a lo mismo, no arrancaba hasta que hice "el ritual".

la verdad no aportas muchos datos dices que la fuente es nueva pero no dices ni la potencia de la fuente ni la marca,
Tampoco dices si tienes la ram esta puesta con el perfil xmp o puestos los timings y velocidad a mano y si la ram suele dar ese fallo y muchos otros con los ryzen .
A mi cuando e puesto ram con ryzen a veces y e querido vajar lo masimo posible los timings me a dado ese error.
DE echo segun lo que cuentas no tiene pinta de estar fallando la grafica si no la fuente o la ram del pc en si,
Gracias a todos por los consejos. Menciono de nuevo que la gráfica nunca ha mostrado artifacts ni símbolos visibles de muerte cercana, mis únicos indicios que me dicen que el fallo puede estar ahí es el LED de la placa base cuando decide no arrancar (enciende el piloto de VGA) y el MATS de Nvidia pero que esto puede ser un falso/positivo.

@prison1287 Las memorias son nuevas de hace apenas 2 meses y están con un perfil XMP por defecto de fábrica. Resulta que hace ese tiempo el PC también se negaba a arrancar muchas veces pero en ese caso la placa me indicaba que era la RAM el fallo, compré dos módulos nuevos por probar y se acabó él problema así que me los quedé. Sobre la fuente la puse unos post atrás, es ésta comprada el 05/2022 https://www.pccomponentes.com/evga-700- ... mi-modular

Realmente mi PC es un mechero, tengo UV aplicado en la CPU y GPU y entre ambas al 100% de uso no llegan a los 200Watts (45W CPU y unos 125W la GPU), entre eso y que la fuente es relativamente nueva la verdad me cuesta creer que sea el fallo, pero también ha podido salir rana osea que tampoco lo descarto. Como digo probaré la otra fuente que tengo para ver si esto sucede de nuevo... el tema esque esa fuente la compré en 2007 y estuvo a full hasta 2015 mas o menos, desde entonces está guardada como respaldo y no se yo cuanto mas dará de si xD

@Kanijo1 Creo que mi placa sólo me deja cambiar la Gen del PCIe, pero con bajarla a 2.0 sería como tener un 3.0x8 no?? Mi problema no es similar al tuyo, me la reconoce y funciona perfectamente, excepto cuando le da por ahí y se niega a arrancar, pero por probar cosas no pierdo nada.
garbaje_de_potanzos escribió:@Kanijo1 Creo que mi placa sólo me deja cambiar la Gen del PCIe, pero con bajarla a 2.0 sería como tener un 3.0x8 no?? Mi problema no es similar al tuyo, me la reconoce y funciona perfectamente, excepto cuando le da por ahí y se niega a arrancar, pero por probar cosas no pierdo nada.


No funciona del todo así. No tiene nada que ver la generación del pcie y las lineas de éste, pero algunas placas pueden limitar las lineas dependiendo de la gen. es decir, hay placas que pueden funcionar en gen3 x16 o en gen4 x8 (y no te deja subir mas), depende de la placa, la cosa es ver si por ahí viene el fallo, está claro de que, a veces, la placa no te reconoce la gráfica por un motivo u otro, y lo que puede pasar es tengas algún conflicto de este estilo, que lo tengas en auto, y haya veces que la placa automáticamente cambie de modo y otras veces no.

Que placa tienes? Que versión de la BIOS tienes?
13 respuestas