Bueno veréis es una duda que me surge todos hemos visto alguna vez algún articulo o post en una pagina web cualquiera que nos ha gustado y decidimos conservarlo en general para estos casos hacemos el típico "
Copy and Paste" y lo guardamos en un documente de Word, Texto o PDF (mismamente yo lo he hecho con algunos post de aquí de EOL).
El problema surge cuando en lugar de ser 1, 2,3... o 24 artículos nos encontramos una pagina que por cualquier cuestión tiene artículos que nos resultan muy valiosos y no son pocos (como por ejemplo 6000 o más artículos) que querías conservar por si de repente un día cualquiera la pagina cierra y todo ese material se pierde para siempre quedando solo en tu recuerdo.
Bien esta claro que en estos casos hacer un "
Copy and Paste" de semejante cantidad de artículos es imposible para una sola persona sin sacrificar al menos un mes entero trabajando las 24h al día.
Bien la pregunta es ¿Existe algún programa que automáticamente sea capaz de coger dichos artículos (respetando la codificación de caracteres) y guardarlos en Word o PDF?
Seria algo así como los programas de renombrado masivo de archivos pero en lugar de renombrar archivos convirtiendo artículos de una pagina web a Word.
La pagina de la cual hablo es
http://www.lapizarradeyuri.com/ aunque podría agregar otras como
http://francis.naukas.com/ o
http://danielmarin.naukas.com/ en fin tengo una ristra de sitios de divulgación cientifica cada vez más grande (que literalmente contienen el conocimiento de la humanidad...
![partiéndose XD](/images/smilies/biggrin.gif)
).
He probado a descargarme la base de datos de la pagina en cuestión usando HTTrack Website Copier y WebSuction.
Pero aunque si bien es cierto que estos programas lo que hacen es descargarse todos los datos de dicha pagina a "piñón" no es eso lo que busco (yo no quiero las fuentes o las hojas de estilo o.....) yo querría algo tan simple como que la información de texto de dicha pagina se me guardara en Word (con las imágenes de dicho articulo si las hubiese).
Todo esto bien a raíz de lamentablemente hace 2 días me encontré con que una de las múltiples artículos que utilizaba a menudo (y que tenia en marcadores) había sido borrado por que la pagina había cerrado (por si os interesa dicha pagina rusa estaba dedicada en exclusiva al Transbordador Burán y tenia una muy buena tanda de artículos (en ruso claro) sobre el desarrollo, características,vuelos he historia de todo el programa Burán Soviético con información técnica he informes oficiales desclasificados).
Lamentablemente se han perdido de dicha pagina sin exagerar almenes 200 artículos dedicados al programa Burán con la enorme perdida de material y conocimiento.
Saludos