Monitorización y detección de sobrecarga o falta de memoria

Hola,

tengo unas maquinas un poco problematicas corriendo Debian GNU/Linux en mi curro y me gustaría saber si conoceis alguna herramienta para monitorizar y detectar cuando hay sobrecarga de la CPU (por ejemplo CPU al 99% durante más de 30 segundos) o falta de espacio en el disco duro (partición con más de 90% usado, p.e.). He visto algun script que detecta cuando se ha alcanzado un porcentaje del espacio en disco o particion pero ninguna herramienta que lo integre todo y permita avisar al administrador mediante un correo.

Saludos!
Te hablo asi de memoria sin mucho conocimiento... pero tal vez te sea de ayuda para investigar o guiarte.

Puedes usar monitores de servidores como webmin, nagios, etc, en ellos podrias visualizar y supongo que programar tareas para x eventos.

Y hace no mucho vi un programa llamado tal vez Tasker que permitia ponerle condiciones en caso de que un proceso chupara mas de de X memoria o CPU o se alcanzara ese valor limite en el sistema asignandole entonces tareas como xkill o semejantes.

En tu caso seria añadir tambien a las condiciones que te enviara un correo ademas de vigilar la cuota de disco.
el_Salmon escribió:Hola,

tengo unas maquinas un poco problematicas corriendo Debian GNU/Linux en mi curro y me gustaría saber si conoceis alguna herramienta para monitorizar y detectar cuando hay sobrecarga de la CPU (por ejemplo CPU al 99% durante más de 30 segundos) o falta de espacio en el disco duro (partición con más de 90% usado, p.e.). He visto algun script que detecta cuando se ha alcanzado un porcentaje del espacio en disco o particion pero ninguna herramienta que lo integre todo y permita avisar al administrador mediante un correo.

Saludos!

pandora o cacti te hacen el trabajo

pero necesitas otra maquina [+risas]
Lo ideal es que montes un sistema de monitorización (yo te recomiendo Nagios), o si no quieres montar nada, pues te tocará scriptear :)
Saludos!
No necesitas otra máquina con algunos de esos sistemas, el propio equipo puede monitorizarse a sí mismo. Con Munin puedes hacer gráficos de uso de cpu, ram, io, etc... Todos esos los hace automáticamente Munin, pero tú puedes crear los que quieras nuevos.
Yo uso Monit, es exactamente para lo que tu quieres y con una configuracion bastante simple:
check process sshd with pidfile /var/run/sshd.pid
   start program  "/etc/init.d/sshd start"
   stop program  "/etc/init.d/sshd stop"
   if failed port 22 protocol ssh then restart
   if 5 restarts within 5 cycles then timeout


Mirate algunos ejemplos porque es muy adaptable ;D
Yo he usado Monin/Monit y me han ido bien....
Puestos a dar alternativas... ¿has mirado zabbix?

Salu2;)
Por experiencia te recomendaría Nagios. Podrás controlar todo estos eventos, discos, si está viva la máquina. Otro tema ya es el de la CPU, que por lo que dices necesitas algo más proactivo. Aquí Nagios, como otros, falla un poco ya que los chequeos son programados cada x minutos. Lo que puedes hacer es algún script para Nagios para este tema de la CPU.
Googleando un poco seguro que encuentra info.

Saludos
8 respuestas