Problema: Servidor zombie en Debian

Hola

Primero disculpar las aberraciones que pueda decir durante el post porque el mundo para mí es galaxia todavía.

Tengo un servidor proliant ml110 que ha estado funcionando perfectamente durante 4 o 5 años con Suse 7 (ya se que es viejo). Hace unos meses quise actualizarlo para que pudiera ser usado como servidor de medios. El equipo dispone de 2 discos duros de 1 tb en raid 1 para copias de seguridad (creo), otro de 1 Tb para el sistema, y otro 1 tb para la multimedia digamos.

Llamé a un técnico el cual me instalo Debian, puso un escritorio unity, y en principio todo se quedó funcionando.

El caso es que al cabo de unos meses el equipo iba fatal, el escritorio unity a penas se movía con soltura hasta que el equipo se colgó, reinicie, y salieron todos los problemas:

1. El primero era con la gráfica dando un mensaje de error en el que el hardware de video no podía ser iniciliazado. Le puse una gráfica nueva, instale sus drivers correspondientes y funcionó otro par de semanas.

2. Otro problema: aviso de actualización, y mensaje de no hay espacio en tmp, en var/lib... vamos, 300 gb que tiene el sistema para el sólito y no he conseguido por más que he probado a solucionar este problema. He limpiado cache, cores antiguos ampliado etc...

3. El desastre: el equipo directamente no arranca, se "cuelga" al arrancar el entorno gráfico y no hay forma de que cargue ninguna X, es más, si accedo por terminal, se cuelga por completo.

La cuestión es que esta en modo zombie, los servicios siguen funcionando (plex, samba...) pero no hay forma de gestionar el equipo, la sesión en terminal me puede durar 5 o 10 minutos antes de que muera. Si lo dejo "colgado" puede estar días que no pasa nada, pero quiero volver a tener mi servidor y no una especie de NAS con vida propia.

Había pensado en formatear yo mismo pero me da pánico el tema del Raid. En mi mente Windows podría coger los Hdds y pincharlos en otro equipo y salvar la información, pero en este, que casi con seguridad están en ext4, que no se que raid tiene exactamente (creo que es espejo), que la información de los Hdds no quiero perderla:

¿Que harías vosotros contando que el servidor es accesible de forma limitada por terminal?

P.D. Siempre me han dicho que Linux "no hay quien lo tumbe", sera verdad, porque el servidor inaccesible y los servicios funcionando
Seguramente tengas raid espejo, saca un disco, conectalo a un pc con linux y copia los datos.

Luego yo haria una imagen con clonezilla del sistema cmo lo tienes actualmente y le meteria un format, que no consigues hacerlo? Restauras la imagen de clonezilla.
Creo que tienes fallos de concepto, entre ellos, lo de "Debian con escritorio Ubuntu". Supongo que en realidad tendrás un Ubuntu o tendrás un Debian con Gnome...

Por otro lado, si los discos duros los tienes en Raid, los verás como un único disco de 1 GB, por lo que no tendría sentido lo de "1 TB para Sistema y otro para multimedia".

Si el técnico te hizo particiones, podría haber puesto el tmp en una con poco espacio y por eso te falta espacio.

Supongo que tendrás algún problema de configuración de en el entorno gráfico por algún motivo. Recuerda que Linux puede gestionarse sin problemas desde línea de comandos, pudiendo arreglar el entorno gráfico si fuese necesario.

Cuando arranca el equipo, ¿te permite introducir usuario y contraseña? Si no es así, prueba a pulsar Control + Alt + F3 a ver si desde otra terminal puedes acceder al equipo.
¿?, Debian con escritorio Ubuntu, server con escritorio?, WTF?, Si tienes Unity, tienes Ubuntu instalado sin mas.

1-Un server no necesita grafica, si eso con una integrada va sobrado para streaming.
2- Usa en "analizador de espacio en disco), o el comando df -h que es bastante útil para saber que se lo esta comiendo y donde.
3-Si tienes problemas, no ha espacio libre... no arrancara las X, aun asi hay logs para algo.

Si es un server y no entiendes mucho mirate Zentyal ^^, administracion web, a base de click y si hace falta tiene escritorio, ademas de que por ssh puedes instalar cualquier programa que necesites sin problemas al ser repositorios de Ubuntu.
Supongo que ese debian ubuntu se llama Ubuntu server. Y es muy probable que actualizandose, se haya roto el sistema y por eso los fallos.

Lo primero es mirar los archivos logs /var/logs/
organizar por fecha ls -rt y mirar los ultimos logs para ver que esta pasando en el sistema. Comprobar el espacio como te dijeron mas arriba y ver como anda el consumo de la ram y el tiempo de carga del cpu. Esto es mas facil de ver con el programa htop.

saludos
Gracias a todos por las respuestas y perdón por el huevo de Ubuntu, en domingo se me desconecta el raciocinio. [carcajad]

Para recapitular pongo un resumen del estado del server para que quede claro:

1. Hdds son 4 en total:
- 250 Gb para sistema (físico)
- 2x1 Tb en Raid espejo para copias de seguridad
- 1 Tb para multimedia en general.

2. El sistema ya tengo mis dudas si es debian o ubuntu server. Me decanto por Debian con un escritorio Unity. Al servidor se le puso entorno gráfico para que fuera más "accesible" en cosas relacionadas con la multimedia y backups (véase plex o similares).

3. No tengo acceso a ningún escritorio, no hay forma de arrancar X. Cualquier solución fuera de la terminal me es imposible. Cuando trato de entrar a los logs, solo consigo verlos en parte, porque tras borrarlos, reinicio, y crea un archivo de entre 4-6 Gigas. Un disparate.

4. Solo tengo acceso, digamos normal y fluido a Webmin.

5. Quiero conservar lo que tengo en el Raid y en el Disco multimedia. El Raid se que se hizo vía software pero desconozco como lo montó.

En definitiva, si doy por jodido el sistema, aunque "funcione" a medias, y reinstalo: ¿ Que pasa con el Raid?¿Hay forma de no perder la información?¿Que tengo que saber o buscar?

Gracias de antemano, es que me da pánico cargarme el Raid, hay mucha información.
Yo quitaria todos los discos menos el del SO y reinstalaría.
Luego pinchas he instalas el software del raid y todo lo demás.
6 respuestas