Manipulando pdfs

Question

Manipulando pdfs

auxiliar 05 dic 2008 19:49

MegaAdicto!!!

1.202 mensajes
desde may 2003
en es_ES (i18n)

A ver si alguno tiene experiencia y me puede guiar un poco.

Resulta que de vez en cuando tengo que presentar méritos. Como es un coñazo estar sacando las originales, hacerles fotocopias, incluirles una leyenda de que no se han manipulado, etc... me he decidido a escanearlas y procurar automatizar al máximo el proceso. Lo único que voy a dejar manual es la firma.

Por ahora he hecho lo siguiente:

a) He escaneado las hojas como imágenes.
b) Me he hecho un sellito circular con el inskcape para lo que es común a todas las imágenes (que es "copia fiel", mi nombre, etc.). En azulito un poco disuelto para que parezca hecho con un sello real.
c) Cocino todo con el convert de imagemagick de manera que fundo cada hoja con el sello y genero un pdf donde cada hoja es una de las imágenes.

Hasta aquí todo bien. Pero me falta para completar todo dos cosas:

a) Numerar las hojas.
b) Los méritos están recogidos dentro de un baremo que los divide en distintos apartados, y debo indicar en cada hoja, el apartado correspondiente.

Y aquí estoy que no sé muy bien qué hacer para resolver la papeleta. He echado un ojo por encima a la página de manual del pdftk y he visto que se pueden "rellenar formularios", pero no sé muy bien de qué va la cosa. Lo que se me ha ocurrido es que podría crear un pdf con dos campos (uno para el número de página y otro para el número de apartado del baremo) y rellenarlos luego mediante el "fill_form" de pdftk. El problema es que no tengo ni idea de cómo se crea tal pdf ni cuál es el formato de los xpdf que rellenan esos campos automáticamente, así que la solución quizás es un engorro.

O quizás sea más fácil hacer la operación programando con python, por ejemplo, que es lo que tengo ahora mismo fresco.

¿Alguien puede darme algún consejo?

3 respuestas

Answer 1 · 2008-12-06T12:51:32+00:00

Que yo conozca, un pdf formado por páginas tomadas como grafico no son posibles numerarlas.

Answer 2 · 2008-12-06T12:59:39+00:00

ZX80 escribió:Que yo conozca, un pdf formado por páginas tomadas como grafico no son posibles numerarlas.

¿Y por qué no? No dejan de ser páginas, aunque no haya texto. Basta con que la imagen sea, por ejemplo, la imagen de fondo.

He pensado un poco y voy a intentar lo siguiente:

a) Generar con convert, a partir de las imágenes y mi sello, pdfs, tantos como imágenes hay en vez de uno sólo con muchas páginas como hasta ahora.
b) Crear con python y la librería reportlab, pdfs que contengan solamente el número de hoja y el apartado al que pertenece el mérito.
c) Con pdftk fusionar cada pdf de (b) con cada pdf de (a) (obviamente el pdf de (a) hace de imagen de fondo).
d) Concatener los pdfs resultantes.

Creo que funcionará.

Answer 3 · 2008-12-12T11:38:10+00:00

Probé la solución anterior y valió. Pero al final descubrí que con convert también se puede escribir texto, así que resolví la parte del script de python con el propio convert. Lo he dejado todo en un script de bash y funciona bien, aunque quizás lo más elegante sería hacer un Makefile.