Sólo como idea, y sin aportar mucho... siempre se podría usar el pdf2html y luego un navegador en modo texto...
Claro que no siempre hace la conversión bien, y olvídate del texto escaneado (al menos en la versión que probé yo hace tiempo).
Edit, no había leído el link, ahí lo pone, sorry.