Reinicios aleatorios (resultados del Visor de eventos)

Buenas tardes.

Desde hace un tiempo para acá, empecé a sufrir reinicios aleatorios, que a veces ocurren en dias aleatorios y otras veces ocurren 3 veces en 15 minutos.
Adjunto resultados del visor de eventos.

El equipo es un Q6600 a frecuencias de stock, con una placa Gigabyte P35-DS3L Rev 2.0 con 8GB DDR2 a 800mhz (stock también).
El procesador ya probé varios, y sigue pasando. Le estoy echando la culpa a la fuente de alimentación, una Gigabyte Odin 550W modular, pero ...
Pensé que no podía en principio con la tarjeta gráfica, una GTX 660, pero con una Radeon 4350 ocurre igual.
S.O. Windows 10 64 bits.

- <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
- <System>
  <Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331c3b3a-2005-44c2-ac5e-77220c37d6b4}" />
  <EventID>41</EventID>
  <Version>8</Version>
  <Level>1</Level>
  <Task>63</Task>
  <Opcode>0</Opcode>
  <Keywords>0x8000400000000002</Keywords>
  <TimeCreated SystemTime="2021-12-27T16:16:00.5526535Z" />
  <EventRecordID>28919</EventRecordID>
  <Correlation />
  <Execution ProcessID="4" ThreadID="8" />
  <Channel>System</Channel>
  <Computer>DESKTOP-8230MUU</Computer>
  <Security UserID="S-1-5-18" />
  </System>
- <EventData>
  <Data Name="BugcheckCode">0</Data>
  <Data Name="BugcheckParameter1">0x0</Data>
  <Data Name="BugcheckParameter2">0x0</Data>
  <Data Name="BugcheckParameter3">0x0</Data>
  <Data Name="BugcheckParameter4">0x0</Data>
  <Data Name="SleepInProgress">6</Data>
  <Data Name="PowerButtonTimestamp">0</Data>
  <Data Name="BootAppStatus">0</Data>
  <Data Name="Checkpoint">0</Data>
  <Data Name="ConnectedStandbyInProgress">false</Data>
  <Data Name="SystemSleepTransitionsToOn">3</Data>
  <Data Name="CsEntryScenarioInstanceId">0</Data>
  <Data Name="BugcheckInfoFromEFI">false</Data>
  <Data Name="CheckpointStatus">0</Data>
  <Data Name="CsEntryScenarioInstanceIdV2">0</Data>
  <Data Name="LongPowerButtonPressDetected">false</Data>
  </EventData>
  </Event>


¿Alguien ve algo en el código que yo no vea?.
Gracias y un saludo.
(mensaje borrado)
Esta información del visor de eventos no me parece significativa, o al menos yo no veo nada relevante.

Yo primero revisaría esa placa, un poco antigua, para comprobar el estado de los condensadores.

https://f00.psgsm.net/content/12893/cap ... ailure.jpg
https://www.hometheatershack.com/attach ... jpg.14290/
https://hackaday.com/wp-content/uploads ... uf6.3v.jpg

La fuente, pues vaticino que no será una fuente fiable. No te voy a recomendar que compres una "decente" porque igual el equipo no lo merece, pero si puedes conseguir una para probar, genial.

Saludos.
@dCrypt Voy a intentar probar con otra fuente, pero antes de eso voy a descartar que sea la memoria RAM. Tengo por aquí dos módulos de 2GB (Total 4GB) para probar, extraeré los otros 4 módulos que tiene ahora mismo y probaré con estos dos a ver. Les he pasado Memtest y no han dado problemas, pero por si acaso.
Os voy contando. Gracias y saludos.
Apuesto por la placa, pero todos los tests son buenos. ¿Qué tal se ven esos condensadores?

Saludos
@dCrypt A simple vista los veo bien, pero no sería la primera vez que la vista me juega una mala pasada.
Este ordenador lo tengo en el trabajo (por eso no me importa su antigüedad, me cumple sobradamente para tareas ofimáticas) y cuando el jefe se despiste un rato lo abro y lo observo bien a plena luz del día. Si los veo bien, aprovecho y pruebo lo de la RAM. Si persiste creo que lo próximo será probar fuente de alimentación, pero a ver qué sucede mañana.
Lo de la placa , pues tengo por aquí dos placas más, aunque ambas son mini ATX, y solo disponen de dos slots de Ram, lo cual me limita a 4GB y ahí sí que de verdad me patina un poco.

Saludos, y gracias.
Bueno, pues ya nos cuentas mañana

Saludos
@dCrypt Buenas.

Creo que finalmente he dado con la culpable. La Ram.
Esta mañana lo primero que he hecho es observar nuevamente la placa más a fondo que nunca y no he apreciado ningún condensador hinchado, ni defecto alguno que pudiera afectar al funcionamiento.
Estos días estuve pasando unos Memtest a las memorias y las pruebas fueron positivas, pero con todo y eso me he traido dos bloques más de 2GB cada uno, tal y como dije ayer y he quitado los otros 4 bloques.
Con estos dos bloques en toda la mañana no ha sufrido ni un reinicio ni nada. De momento va fino, y quizás esté pecando de precipitado, pero parece ser ese el problema.

Al no dar problemas los memtest no lo asocié a la memoria, y como estos 4 bloques que tenía llevan trabajando juntos por años, tampoco lo asocié a incompatibilidad entre ellos. Esto pone bastante en entredicho mi impresión de que el memtest era "infalible" [+risas]

Voy a seguir usando el equipo el resto del día con estos dos bloques y si el error no se reproduce, mañana iré pinchando los 4 bloques que he quitado uno a uno hasta encontrar al culpable. Lo bueno de todo esto es que una vez eliminado el culpable, podré seguir usando 8GB de RAM en el equipo, que me da bastante vidilla, la verdad.

Si por algún casual fallaran a lo largo de la tarde, solo me quedaría probar otra fuente, pero bueno, torearé ese toro cuando salte al ruedo.

Muchas gracias por la ayuda.
No descartes que la placa tenga un fallo que afecte a las memorias ....

Saludos.
Creo que ya lo he puesto por ahí, por si te sirve te comento que, desgraciadamente, un evento de tipo Kernel-Power como el que has puesto lo único que nos dice en claro es "el ordenador se ha apagado de forma repentina, y windows no sabe por qué". Vaya, que es el mismo evento si tiras del cable de alimentación, si la placa apaga el PC por sobretemperatura, si hay un cortocircuito y la fuente corta, etc. Solo en casos un poco más concretos de cuelgues (como pantallazos azules, de cualquier tipo, en los que se puede volcar "algo" al disco duro) es más informativo.

A mí me parece muy raro que el memtest no dé errores y esté tocada la RAM, pero bueno, ojalá que sea así y lo tengas solucionado. Yo cuando he tenido algún cuelgue que era culpa de RAM y he pasado memtest me han salido errores a porrillo con solo unos minutos (depende de en qué zona de la memoria o con qué patrón se de puede tardar un poco)

Saludos
dCrypt escribió:No descartes que la placa tenga un fallo que afecte a las memorias ....

Saludos.

La verdad es que no descarto nada, porque la placa tiene ya muchos años, la compré hace creo que 14 años, junto a un Core2 Duo E7200 y me ha dado muy buenos servicios. Es inevitable que por algún lado haya sufrido algún tipo de desgaste, ya sea algún condensador tocado, la misma electromigración ... quién sabe.
Lo cierto es que desde que localicé el bloque que me estaba dando problemas, no he vuelto a sufrir reinicio alguno. Es más, ayer por la tarde le puse los otros 4GB restantes y ya están los 8GB trabajando con total normalidad.
Si veo que a corto plazo vuelvo a tener problemas, probaré con una fuente de alimentación y si persiste, pues nada, despido con todos los honores esta placa que tantos buenos años me ha dado, primero con un C2 Duo, luego el Quad y posteriormente el Xeon (que por cierto creo que volveré a poner para no tenerlo muerto de risa en un cajón, lo quité pensando que podía ser el Xeon).
Gracias por la ayuda, de verdad. [beer]

Pollonidas escribió:A mí me parece muy raro que el memtest no dé errores y esté tocada la RAM, pero bueno, ojalá que sea así y lo tengas solucionado. Yo cuando he tenido algún cuelgue que era culpa de RAM y he pasado memtest me han salido errores a porrillo con solo unos minutos (depende de en qué zona de la memoria o con qué patrón se de puede tardar un poco)

Saludos

Pues sí, a mi también me ha resultado muy extraño, porque lo dejé más de una hora dando vueltas a las memorias, diagnosticando. De hecho es la primera vez que me pasa que no detecta errores y al final el problema resultan ser las memorias. Como lo primero en lo que pensé fue en la ram, al pasar los diagnósticos me centré en otras cosas y claro, me ha llevado más de lo pensado.
Otras veces he tenido memorias que se han fastidiado con el tiempo y siempre acababan saltando con el memtest.
Es que piensas: "vale, memorias ok" y estos 4 bloques llevaban trabajando juntos años y años, difícil pensar que pudieran llevarse mal unos con otros.

Igual me estoy aventurando muy pronto y salta algún reinicio entre hoy y mañana, pero de momento todo parece estable. Antes tenía reinicios diarios y ahora lleva dos días sin ellos. Espero no estar cantando victoria antes de tiempo, jeje.
Saludos.
Para testear las memorias, en mi experiencia 1h de memtest no es suficiente. Muchas veces los vicios ocultos en componentes electrónicos sólo se evidencian tras tomar temperatura, un tiempo de uso, etc

Saludos.
De Memtest hay varias versiones de diferentes desarrolladores, algunas puedes pasarla durante horas y no saltar ningún error.

Yo suelo usar HCI Memtest Pro (de pago) aunque también valdría la versión normal (en este caso hay que ir lanzando una a una cada instancia) y asignando apróx. un 90% de la RAM instalada en el sistema a la suma de todas las instancias (o sea, dividiendo el total de RAM que se quiera asignar entre el nº de instancias) y la misma cantidad de instancias (ventanas simultáneas) que threads tenga el procesador.

Normalmente si la RAM está muy mal, saltan enseguida los errores, aunque a veces hay que ejecutarlo hasta el 1000% en todas las instancias para que detecte errores. Ya a más del 1000% es raro que si no detecta errores los haya, pero puede que también sea posible, aunque en ese caso sería muy raro que diera errores en un uso normal del equipo.

También hay que pensar que si se ha hecho OC al procesador o la RAM, este programa solo testea la RAM, con lo que es posible que en esos casos, al no testearse a la vez la CPU también, pues no se caliente tanto la CPU y pase como estable, pero no lo sea del todo. Lo que he comentado sirve sobre todo si no se le ha hecho OC al procesador.

Saludos.
javier español escribió:También hay que pensar que si se ha hecho OC al procesador o la RAM, este programa solo testea la RAM, con lo que es posible que en esos casos, al no testearse a la vez la CPU también, pues no se caliente tanto la CPU y pase como estable, pero no lo sea del todo. Lo que he comentado sirve sobre todo si no se le ha hecho OC al procesador.

Saludos.

Sí, normalmente tengo este Q6600 a 3.0Ghz pero precisamente para evitar ese problema que comentas, lo primero que hice fue cargar las opciones en bios por defecto, y las test de memoria y demás pruebas se han hecho con el procesador a 2.4Ghz. En realidad en lo primero que pensé cuando los reinicios fue en el overclock del procesador.
El equipo sigue encendido y estable, por cierto.
Saludos.

Edito 31/12/2021

Esto es la leche. Ahora resulta que el PC va perfecto, no se reinicia, incluso probé con el Xeon y lo puse a 3800mhz ... perfecto, 0 reinicios y 0 problemas pero ... la hora del PC va acelerada, el segundero marca 1 segundo cada 0.6 segundos aproximadamente y he advertido que poniendo el procesador a velocidades de stock del Q6600, no sucede.
Es decir, puesto el Xeon a 3.8Ghz, el reloj va acelerado y los juegos también van acelerados. Si pongo el Xeon a la velocidad de stock del Q6600 (2.4GHz) el reloj y los juegos van a su ritmo. Cada mhz que le subo, acelera tanto el reloj de Windows como la velocidad de los juegos, indistintamente de si tienen activado Vsync o no.
Con el Q6600 ahora mismo me está pasando lo mismo. A 2.4Ghz perfecto, a 3.0Ghz ya todo se acelera. He buscado información en internet y no he encontrado nada.

¿Qué puede ser?. La pila del CMOS la puse nueva hace unos meses. ¿Desinstalar los drivers del procesador y reinstalar? ¿Un formateo? Sería lo último que haría, el coñazo de reinstalar y sobre todo configurar redes y programas nuevamente me llevaría día y medio solo para eso. Flipante.
@Kaiser Sport raro, raro... prueba haciendo un Clear CMOS cuando cambies de procesador por si acaso, pero no le veo lógica a lo que comentas de la hora del sistema, la verdad.

Saludos.
@dCrypt @javier español Bastante ilógico todo, ¿verdad?. Hasta probé a bajar el multiplicador para bajar la frecuencia del procesador y el tiempo se ralentizó ... Es como si el sistema operativo detectara que el micro tiene que ir a X mhz y cuando sube o baja, el reloj del sistema actua en consecuencia. De verdad que sigo sin terminar de entenderlo y no hay nada de información en Google acerca de esto. Sí he visto otros preguntando por problemas similares y la gente recomendaba cambiar pila de la CMOS y tal, pero nadie dió nunca con la solución.

En fin, al final conseguí que Windows detectara correctamente el micro de nuevo (el X5460) y funcionando a 3.16Ghz todo va perfecto. Si lo subo se acelera [poraki] pero bueno, lo dejo así porque aun en invierno el condenado es un horno. Y total ... para ofimática ...
Lo de los reinicios pasaron a mejor vida, así que podemos decir que eran las memorias, por cierto.
Os agradezco enormemente la ayuda a ambos. Feliz Año Nuevo!
15 respuestas