Questa è una bella domanda.....
Avevo trovato tempo fa (x un altro progetto) una cosuccia in Linux che trasformava in testo i pdf..... era x un motore di ricerca interno ....
Oppure potresti creare qualche cosa in c# e la relativa libreria x la manipolazione dei pdf (itextpdf se non ricordo male, ma cmq non è l unica disponibile free).....
ICQ@Home # 47938486
ICQ@Work # 246829394 [ NOT AVAIABLE NOW ]