¿Problema de Hard? ¿De soft?

Os cuento, porque hace tiempo que me están pasando algunas cosas raras en el equipo.

Desde hace no mucho he visto como bajaba archivos RAR de varias fuentes y no funcionaban. Uno de 3,5 Gb de rapidshare, otro de 700 Mb de bittorrent... y al intentar descomprimir me daba error CRC, no me dejaba. Llegué a copiar el de 3,5 a otro PC con Windows y tampoco, parecía que el problema era del archivo, que estaba corrupto. Lo bajé otra vez, ya que la persona que lo había subido aseguraba que estaba correcto, y me ocurrió lo mismo otra vez. Una tercera, y lo mismo.

El otro día reinicié y al comprobar Ubuntu el disco se quedaba atascado al 70%, y no pasaba de ahí. Si le daba a Escape ANTES de llegar al 70% podía usar el sistema con normalidad, pero de todos modos decidí formatear. Hice copia de seguridad de mis datos y creé una tabla de particiones nueva, con 5 Gb para /, 5 reservados para probar Intrepid, 500 de swap y el resto para /home. Instalé Hardy en ambas particiones de 5 -pensando en actualizar una de ellas- pero luego descubrí que la otra no arrancaba. Volví a instalar, bajé las actualizaciones pero me encontré un problema de falta de espacio -pese a que Nautilus decía que quedaban 2 Gb libres en /- y bueno, tras limpiar la caché pude acabar de actualizar. Para encontrar después que NO ARRANCABA. Instalé otra vez y ahora funciona el equipo, aunque anoche por las buenas me quedé sin fondo de pantalla, ya que la imagen que tenía (en /) daba ERROR CRC al intentarla abrir.

Ayer me pasó alguna vez que al intentar abrir Firefox me daba fallo de segmentación.

Hoy he bajado otros cuantos archivos de 700 Mb, y he visto con extrañeza ¬_¬ que no se descomprimen. El error que me da File-roller no es nada específico, sencillamente me pide password, para un archivo que no está protegido por password.

Hoy me he decidido a bajar el archivo del que hablaba al principio, el de 3,5 que bajé varias veces, desde el otro PC con Windows. Y funciona correctamente.

Para más INRI, al instalar las fuentes ayer me dio un error, y ahora cada vez que intento instalar o desinstalar algo me sale esto:

E: msttcorefonts: el subproceso post-installation script devolvió el código de salida de error 1

Me deja, sin embargo, completar la instalación, a no ser que lo que le pida sea desinstalar msttcorefonts. En ese caso no procede.

¿Qué creéis que le pasa a mi equipo?
Vigila el log del kernel con dmesg, pero es casi seguro de que el disco duro esté agonizando (o la controladora, pero esto ya es más raro).
El caso es que no creo que el disco tenga más de tres meses.
Todo puede haber sido mal fabricado, y más siendo algo mecánico ;)
Puedes echarle un vistazo al disco con smartmontools (http://www.google.com/search?q=smartmontools) y a las memorias con memtest (http://www.memtest86.com/ o su copia http://www.memtest.org/ -no recuerdo cuál es el que suelen traer las distribuciones, creo que el +).

El primero es bastante rapidillo, lo puedes usar desde tu linux (aunque quizá sea mejor buscar un live cd ya que tienes tantos problemas) y comprueba unos parámetros internos que guarda el disco y que te pueden decir si ha sobrepasado el número de horas de vida, si hay errores mecánicos, etc.

El segundo comprueba si dan errores las memorias. Si haces un test completo puede tardar muchas horas, por lo que te recomiendo que lo dejes por la noche.

No uses para tus pruebas ningún archivo que tuvieras antes de formatear, si el formato o el disco estaban mal, es más que probable que el archivo esté corrupto.

Por otro lado siempre puedes probar a cambiar alguna pieza (si tienes en casa otros ordenadores o piezas viejas) para ir descartando fallos.

Que sea leve. Un saludo.
Es posible que sea problema de la memoria... una opción podría haber sido tomar el sha1/md5 de varios de esos ficheros en varios momentos del día distintos y ver si concuerdan.

De todos modos, sin saber mucho más, y dando palos de ciego, suena a memoria/micro. Yo empezaría por pasar el memtest

- ferdy

OJO: No he leído el informe sobre SMART que has pegado, no tengo tiempo.
Ferdy escribió:Es posible que sea problema de la memoria... una opción podría haber sido tomar el sha1/md5 de varios de esos ficheros en varios momentos del día distintos y ver si concuerdan.

De todos modos, sin saber mucho más, y dando palos de ciego, suena a memoria/micro. Yo empezaría por pasar el memtest

Gracias por la ayuda y perdón si pregunto alguna burrada, pero en lo tocante a resolver problemas de harware soy totalmente analfabeto.

Para pasar el memtest, sencillamente elijo la opción correspondiente en el menú de inicio ¿no? La opción correspondiente a mi kernel, seguida de memtest86+.

¿Qué hago cuando acabe la prueba? ¿Vuelca los resultados a un archivo que pueda copiar, o tengo que mirarlo "a ojo"?
Memtest es independiente de Linux, lo arrancarás desde el Grub/lilo como otro kernel distinto. Los resultados salen en pantalla, con un contador de errores. Los errores deben ser 0.
Esos problemas que tienes son tipicos errores de memoria. Como bien te han dicho, pasa el memtest. Pero estoy al 99% seguro que es memoria.
Pero estoy al 99% seguro que es memoria.

Eso me pasó a mi una vez, y acabé teniendo que cambiar el micro .

Si el memtest da 0 errores, lo suyo sería probar un micro distinto.

- ferdy
¿Cuántas pasadas se supone que da el memtest? Ya lleva tres pasadas y cero errores, y sigue y sigue. ¿Da cinco? ¿Diez? ¿Cien?
No va a parar. Cuantas más veces lo pases mejor. Déjalo unas horitas (mejor por la noche) y si no te ha dado ningún error puedes descartar errores de memoria. Al menos es lo que yo haría para estar seguro...

Yo también optaría como primera opción que la memoria estuviera chunga.

Pero me ha venido a la cabeza un caso de cierto hardware que daba problemas, quizá sea el tuyo.

Firewall por hardware en las Placas con nForce 4 U

A ver si hay suerte.
Bueno, lo he tenido 8 horas y ha dado diez pasadas, cero errores. ¿Puedo concluir que no es un problema de memoria, que es del micro? ¿Mi próximo paso debería ser ir al PC box, a ver cuánto me costaría cambiárselo?
Lo del smartctl, (aunque es un poco infernal de leer tal y como lo has pegado aquí) no tiene muy buena pinta (fíjate en todos los FAILING_NOW que tienes por ahí, tests interrumpidos...)

Para probar el disco duro haz:
sudo smartctl --test=short /dev/sda

Te pondrá entre otras cosas algo como:
Please wait 1 minutes for test to complete.

Pasado ese tiempo, ejecuta:
sudo smartctl --all /dev/sda

Y pega la parte de resultados, como ésta:
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 1574 -
# 2 Short offline Completed without error 00% 1574 -
# 3 Short offline Completed without error 00% 516 -

Luego repite todo usando --test=long en el primer paso.
