Gráfica averiada, posibles motivos?

Hola, desde hace un par de días sin motivo aparente el pc se me reiniciaba aleatoriamente con pantalla negra, consultaba los logs de windows y sólo me aparecía "error de windows". Pues bien, después de investigar un poco me dí cuenta que la gráfica (2080 ti) estaba algo más caliente de lo habitual, así que le cambié la pasta térmica, como he hecho antes en casi todas las gráficas que he tenido los últimos 25 años....el caso es que desde entonces, enciendo el pc con normalidad, temperaturas normales, pero al entrar en cualquier juego que tire de gráfica (he probado el convergence por no usar juegos top que me vuelven a reiniciar el pc) la temperatura sube de los 55/57º que tiene en idle a 83º poniendo los ventiladores al 90%, instantaneamente. He desmontado la gráfica, la he limpiado, y no veo quemazos en la placa y no me ha pasado nada parecedo, ya que no aparecen artifacts ni nada, simplemente sube la temperatura muchísimo en 1 segundo y creo que el reinicio es porque llega a la temperatura de corte y no sé el motivo. Si alguien que controle puede saber el motivo agradezco cualquier info. Un saludo.
¿Antes de abrirla llegaste a mirar las temperaturas?

En cualquier caso por los síntomas te diría 99% seguro que el contacto del disipador con la GPU no es el adecuado después de haberla desmontado. Si se pone a 83ºC nada más abrir el juego y con los ventiladores al 90% no baja es que el disipador está en el ártico y la GPU mantiene la temperatura de 83ºC porque el boost baja a lo bestia (justamente es la temperatura a la que empieza el throttling, así que tiene todo el sentido del mundo). Notarás que es esto porque incluso si apagas el PC al momento el disipador estará frío o como mucho ligeramente templado (55ºC no se pueden aguantar con la mano, si el disipador estuviera a 83ºC causaría quemaduras tocarlo más de un segundo)

Revisa los tornillos, especialmente los 4 más cercanos al chip gráfico. Si has cambiado los Thermal Pads, asegúrate de que has usado el grosor correcto, es muy típico ponerlos demasiado gruesos y que pase lo que comentas. Si no los has cambiado, revisa que ningún thermal pad se haya doblado o esté pillado en zonas que no debería.

Los apagados del principio no creo que fueran por temperaturas. Porque la gráfica primero baja frecuencia, y solo llega a la temperatura de corte en casos muy muy escandalosos (por ejemplo, todos los ventiladores parados durante varios minutos).

Saludos
@Pollonidas Había pensado en eso que comentas de los thermal pads, al desmontarla ha habido un par que estaban hechos mierda y he tenido que quitar un trozo, pero pensaba que no afectaría hasta ese extremo. En cualquier caso voy a probar a cambiarlos todos como comentas y a ver si hay suerte. Muchas gracias por la respuesta. Sigo oyendo opiniones ;)
@parradoesekai hace pocos dias tuvimos un caso igual, lo sintomas son de disipador que no hace contacto con el chip GPU.

Puedes hacer una prueba muy rapida, limpias pasta termica, pones una gota de pasta, no la distribuyas, la dejas como esta, pones el disipador y lo atornillas, conforme acabes de apretarla, desmontas y ves si la pasta se esparcio por el chip para ver si hacen contacto.
@ivan95 eso lo probé, justo después de cambiar la pasta y hace contacto en todo el chip.
@emiliojrc una seasonic 650w platinum. No tiene 2 años todavía. En principio descarto que sea eso.
@parradoesekai ufff esto se pone complicado entonces.

Prueba a reproducir un video en Youtube a 4K 60 fps, para ver si tambien sube la temperatura a lo loco hasta con algo que no es muy demandante.

¿En reposo con la ventilacion al minimo a que temperatura se mantiene?
@ivan95 Con un video 4k 60fps el pc se mantiene igual que en idle, 56Cº con los ventiladores en torno al 35%. Con la ventilación al mínimo, que es al 25% en afterburner no hay diferencia de temperatura, se mantiene a 56Cº en idle.
parradoesekai escribió:@Pollonidas Había pensado en eso que comentas de los thermal pads, al desmontarla ha habido un par que estaban hechos mierda y he tenido que quitar un trozo, pero pensaba que no afectaría hasta ese extremo. En cualquier caso voy a probar a cambiarlos todos como comentas y a ver si hay suerte. Muchas gracias por la respuesta. Sigo oyendo opiniones ;)

Siento insistir en el tema, pero es que cuando hay síntomas como los tuyos la gente siempre me asegura que el contacto con el chip es bueno, que la pasta térmica se reparte correctamente, etc. y a la hora de la verdad termina siendo mal contacto.

El tema al que se refiere el compañero es este: hilo_rx-570-4gb-me-apaga-el-pc-despues-de-un-tiempo-de-uso_2484220

Si quieres hacer la prueba, algo muy fácil de hacer es quitar TODOS los thermal pads y ver si las temperaturas vuelven a sus valores normales. Todos los componentes de una GPU (fases y RAM incluidas) pueden aguantar unos cuantos minutos sin thermal pads ni refrigeración directa, de hecho según qué montador deja cosas delicadas al aire por diseño (cosa que suele dar problemas a largo plazo). No te pongas a pasar un furmark o similar porque probablemente se apague pero hay un riesgo de que se rompa algo. Pero abrir un juego, probar 5 minutos y cerrarlo lo puedes hacer sin problema. Si las temperaturas se arreglan por completo ya sabes que tienes que pedir un juego nuevo de thermal pads, de las medidas correctas.

Saludos
Pollonidas escribió:
parradoesekai escribió:@Pollonidas Había pensado en eso que comentas de los thermal pads, al desmontarla ha habido un par que estaban hechos mierda y he tenido que quitar un trozo, pero pensaba que no afectaría hasta ese extremo. En cualquier caso voy a probar a cambiarlos todos como comentas y a ver si hay suerte. Muchas gracias por la respuesta. Sigo oyendo opiniones ;)

Siento insistir en el tema, pero es que cuando hay síntomas como los tuyos la gente siempre me asegura que el contacto con el chip es bueno, que la pasta térmica se reparte correctamente, etc. y a la hora de la verdad termina siendo mal contacto.

El tema al que se refiere el compañero es este: hilo_rx-570-4gb-me-apaga-el-pc-despues-de-un-tiempo-de-uso_2484220

Si quieres hacer la prueba, algo muy fácil de hacer es quitar TODOS los thermal pads y ver si las temperaturas vuelven a sus valores normales. Todos los componentes de una GPU (fases y RAM incluidas) pueden aguantar unos cuantos minutos sin thermal pads ni refrigeración directa, de hecho según qué montador deja cosas delicadas al aire por diseño (cosa que suele dar problemas a largo plazo). No te pongas a pasar un furmark o similar porque probablemente se apague pero hay un riesgo de que se rompa algo. Pero abrir un juego, probar 5 minutos y cerrarlo lo puedes hacer sin problema. Si las temperaturas se arreglan por completo ya sabes que tienes que pedir un juego nuevo de thermal pads, de las medidas correctas.

Saludos


Nada mas que añadir
@pollonidas Dicho y hecho, he quitado todos los thermal pads y el problema persiste, he seguido haciendo pruebas y aquí hay algo raro porque por ejemplo puedo ejecutar juegos poco exigentes como lol, streets of rage 4, dredge y la gráfica se comporta con normalidad como antes de tener problemas, mantiene temperaturas y el rendimiento es normal. En cambio, ejecuto juegos como resident evil 8, kena, back 4 blood y justo al ejecutar el juego suena durante un instante un sonido tipo coil whine y en ese momento empieza a subir la temperatura hasta los 84Cº de tope y los ventiladores al 85%, sólo en el menu. Alguna idea de si es problema de mosfets o memorias y si puede tener arreglo? Gracias por las respuestas.
Mira que voltaje te mete en la gráfica con el HWMONITOR, si es muy alto, esa es la causa y tendrás que bajarlo con el MSI Afterburner.
@Todopc-WII el idle mete 0,725 v y cuando ejecuto algún juego exigente y se pone a 84Cª sube en torno a 0,83/0,89. No es nada fuera de rango, por lo que he visto el tope de base son algo más de 1.0 v.
parradoesekai escribió:@pollonidas Dicho y hecho, he quitado todos los thermal pads y el problema persiste, he seguido haciendo pruebas y aquí hay algo raro porque por ejemplo puedo ejecutar juegos poco exigentes como lol, streets of rage 4, dredge y la gráfica se comporta con normalidad como antes de tener problemas, mantiene temperaturas y el rendimiento es normal. En cambio, ejecuto juegos como resident evil 8, kena, back 4 blood y justo al ejecutar el juego suena durante un instante un sonido tipo coil whine y en ese momento empieza a subir la temperatura hasta los 84Cº de tope y los ventiladores al 85%, sólo en el menu. Alguna idea de si es problema de mosfets o memorias y si puede tener arreglo? Gracias por las respuestas.

Muy raro.

Que en el menú se oiga coil whine y la temperatura suba incluso más que jugando es normal si no tienes vsync, ya que la carga gráfica es menor pero la gráfica "escupe" todos los FPS que puede, llegando muchas veces a varios cientos o incluso más de 1000, que es un escenario en el que el coil whine es más intenso.

Ahora bien, las temperaturas no deberían ser peores que jugando. El voltaje que tienes es normal. En juegos como LoL, Streets of Rage etc. seguramente el problema no se presente porque están limitados por CPU y la carga gráfica no llega por bastante al 100%

Me parece una solución un tanto mejorable pero de entrada activa vsync (si quieres en el panel de nvidia y que sea forzado para todos los juegos) y prueba. En cualquier caso te recomiendo no jugar largas sesiones sin thermal pads ya que incluso si las temperaturas de GPU están bien otros componentes pueden estar sufriendo.

De MOSFET y de memorias te puedo asegurar que no es, ya que un fallo de los primeros suele ser catastrófico (como para poner la línea de 12V en corto y no encender o peor aún, freír el chip gráfico) y un fallo de las segundas se traduce en otros síntomas que no tienen que ver con las temperaturas (por ejemplo, artifacts en pantalla)

Saludos
@Pollonidas es muy raro, sí, he probado todo lo que me has comentado del vsync sin cambios, además desactive el gsync, ya que mi monitor tiene gsync nativo por si acaso y nada. Explico la prueba que hago para ver si algo mejora: todo esto con hwmoitor ejecutado; en idle la gráfica está en valores normales (54 C, ventiladores al 30%, 0,725v, 1350mhz/7000mhz); ahora bien, ejecuto el juego kena, salen los típicos títulos de desarrolladores y demás y sigue igual y al mostrar el menú del juego en cuestión de 2 segundos la temperatura sube hasta los 80/82 C, se pone al 100% de carga, los ventiladores al 85% y el voltaje oscila entre 0,82/0,87, el clock sube a unos 1500mhz con unos 70fps. En el menu puedo estar así 5 minutos sin que cambie nada y al salir del juego la temperatura vuelve a la inicial en otros 2 segundos, rarísimo. No sé qué mirar más, he probado a reinstalar drivers con ddu por si acaso, cambiar puertos de la gráfica y nada.
Que raro, yo te diria que probaras a formatear, por salir de dudas, pero no creo que el problema sea de Software, me da que es algo en la propia GPU o como mucho en la Fuente de Alimentacion.
Viendo que el disipador hace buen contacto según comentas, ¿puede ser que al apretar los tornillos del disipa se fuera un poco de más y, algún punto de soldadura se haya ido o esté haciendo mal contacto y produzca este efecto?
Gracias por las respuestas, ya formateé y nada y en cuanto a los tornillos creo que no puede ser porque la abrí por primera vez a raíz de empezar a tener problemas… estoy pensando en buscar a alguien que controle para que intente arreglarla o sino venderla así para alguien que sepa porque esto tiene que ser una tontería porque la gráfica sigue funcionando pero yo no llego a ver dónde está el problema y me estoy rallando bastante.
@parradoesekai ¿La caja tiene buena ventilación? Que el aire esté muy caliente en el interior de la caja también podría explicar lo que te pasa. Que las temperaturas cambien en 20-30ºC en pocos segundos al abrir/cerrar el juego es normal, y más acusado cuanto más pequeño es el disipador de la misma (menos volumen de cobre/alumino para hacer de "colchón" térmico)

Saludos
Prueba la grafica en otro PC si te es posible, asi descartas fuente de alimentacion.

Mas cosas no se me ocurren, es muy raro😅
20 respuestas