Si bien es cierto que al principio tuiteamos lo de "problema de hardware", acabó siendo puramente software. La gente de Comvive desde el primer momento nos ayudó para descartar rápidamente un disco roto o algo similar, así que ellos no merecen más que agradecimientos
Todo empezó con un disco llenándose de forma rápida e inesperada durante la madrugada del día 6. Eso normalmente no provocaría otra cosa que una simple parada de MySQL y un cartelito de error, pero por razones que todavía no están claras apareció corrupción de datos.
Desde las 9 hasta aproximadamente las 18h intentamos por todos los medios solucionar "in-place" esa corrupción, sin éxito. Insistimos durante muchas horas en esta opción porque creíamos que sería la más rápida que nos permitiera mantener el 100% de los datos sin pérdidas. Pero al final la abandonamos y decidimos restaurar de backup, que entre pitos y flautas no se pudo completar con éxito hasta aproximadamente las 3 de la madrugada del día siguiente. Un rato después reabrimos la web, con el 100% de los datos recuperados.
Los procesos los teníamos, pero nos falló quizás la ejecución. Ya sabéis el chiste de la factura del ingeniero, 1 euro por apretar un tornillo, 1000 euros por saber qué tornillo apretar
Pero como punto positivo, si nos volviese a ocurrir de nuevo probablemente serían muchas menos horas de parada, y ahora además tenemos claro qué pulir del sistema de backups para que puedan ser aún menos.