Ricerca su file pdf

di il
14 risposte

Ricerca su file pdf

Buongiorno, devo effettuare una ricerca su un file pdf, un topografico di una scheda elettronica, di tutti gli elementi che la compongono.
Non programmo da tanto tempo e l'unico linguaggio che conoscevo è il c.
Vi chiedo è la strada giusta riprendere, quindi impararlo nuovamente, oppure sarebbe più opportuno farlo con un altro linguaggio di programmazione?

14 Risposte

  • Re: Ricerca su file pdf

    Se possiedi Acrobat (non reader), è possibile creare dei plug-in in C o Javascript per fare quello che chiedi. Ti serve Acrobat SDK (se esiste ancora, sono anni che non faccio più plug-in). Non è una passeggiata... Considera se è possibile salvare il testo del pdf e fare ricerche nel testo, forse è più semplice.
  • Re: Ricerca su file pdf

    Lavorare con i PDF e' un bagno di sangue: il PDF NON E' un formato pensato per manipolare bene il testo, ma SOLO PER VISUALIZZARLO BENE.

    Quindi, in generale, estrarre il testo dal PDF e' TUTT'ALTRO CHE BANALE ANCHE avendo delle librerie che aiutano in tale senso.

    Comunque, esisto librerie free un po' per tutti i linguaggi, ma AL MINIMO devi sapere C++ e NON SOLO IL C.
    Alternative sono C#, Python, Java.
  • Re: Ricerca su file pdf

    Questo è molto semplice http://www.squarepdf.net/parsing-pdf-files-using-itextsharp , ed è in csharp ma dacci un occhio perchè è veramente semplice,come ide puoi usare o sharpdevelop o visual studio community entrambi gratuiti
  • Re: Ricerca su file pdf

    Signori vi ringrazio.
    Immaginavo che fosse un problema non da poco e lo avete confermato.
    Proverò a percorrere la strada che mi ha consigliato gian82.
    Vi aggiorno se faccio progressi o se ho altri dubbi.
    Grazie ancora a tutti.
  • Re: Ricerca su file pdf

    In realtà è piuttosto banale, si fa anche su file pdf raster (con minore attendibilità).
    Estrazione tasto più ricerca full text, personalmente uso sphinx, una volta diretto, oggi con plugin come Engine per mariadb
  • Re: Ricerca su file pdf

    A parte il fatto che lo puoi fare direttamente dal PDF stesso:
    How to convert PDF to Notepad file on Windows? - PDF Helper
    https://www.pdf-helper.com/pdf-to-text/how-convert-pdf-to-notepad-file-windows.htm

    Ci sono un sacco di utility eseguibili da linea di comando. Una tra le tante
    http://www.xpdfreader.com

    Ma ti basta fare una ricerca su Google con i termini:
    pdf to text commandline
  • Re: Ricerca su file pdf

    In realtà non è poi così banale, devo effettuare una ricerca di una lista di componenti, una bom, in un topografico.
  • Re: Ricerca su file pdf

    sisma ha scritto:


    In realtà non è poi così banale, devo effettuare una ricerca di una lista di componenti, una bom, in un topografico.
    Se la ricerca devi farla da programma ti consiglierei di cercare in rete qualche libreria e/o pezzo di codice in C visto che lo conosci, e da qui farti un programmino ad hoc.

    Se invece devi farlo spot, in rete ci sono vari tool free che permettono l'esportazione in formato testo ( vedi altri componenti del forum che ti hanno dato una dritta ) e da qui a fare una ricerca di un testo è un'attimo
  • Re: Ricerca su file pdf

    sisma ha scritto:


    In realtà non è poi così banale, devo effettuare una ricerca di una lista di componenti, una bom, in un topografico.
    Cosa indendi con "topografico"? Spiega meglio, con dettagli...
  • Re: Ricerca su file pdf

    sisma ha scritto:


    In realtà non è poi così banale, devo effettuare una ricerca di una lista di componenti, una bom, in un topografico.
    Scusa, ma chi ti ha fatto il progetto ti ha lasciato solo gerber e topografico? File cad e schematici non te ne ha lasciati? Nemmeno lo schematico in pdf?
  • Re: Ricerca su file pdf

    Una bom è una lista di componenti che compongono una scheda elettronica mentre il topografico è la rappresentazione grafica, in formato pdf con opzioni di ricerca, della scheda con tutti i suoi componenti denominati R1, R2, R3, C1 ecc.
  • Re: Ricerca su file pdf

    sisma ha scritto:


    Una bom è una lista di componenti che compongono una scheda elettronica mentre il topografico è la rappresentazione grafica, in formato pdf con opzioni di ricerca, della scheda con tutti i suoi componenti denominati R1, R2, R3, C1 ecc.
    Non sei né gentile ne saggio: vieni qua a cercare aiuto su una cosa estremamente specifica e lesini le informazioni!
    Qualcuno di noi sa perfettamente di cosa parli ma credo pochini.
    Un'immagine (che spiega più di mille parole) sarebbe stata interessante.
    Comunque, come dice @Weierstrass: hai provato a chiedere alla fonte? Magari ti danno il file originale!
    Infine, il PDF contiene del testo o un'immagine? Hai verificato? Purtroppo ho visto spesso delle conversioni abominevoli...
    N


    PS: io lo so cos'è; sto facendo proprio ora il routing di un pcb...
  • Re: Ricerca su file pdf

    Nicola non volevo essere né scortese né saccente credimi, non ho mai tempo per poter scrivere.
    Pensavo che con una descrizione più generale potesse risolvere o trovare una soluzione che è utilizzata anche in altri ambiti.
  • Re: Ricerca su file pdf

    sisma ha scritto:


    Nicola non volevo essere né scortese né saccente credimi, non ho mai tempo per poter scrivere.
    Tranquillo!
    Pensavo che con una descrizione più generale potesse risolvere o trovare una soluzione che è utilizzata anche in altri ambiti.
    Purtroppo i dettagli sono indispensabili, soprattutto per cose contorte come i PDF.
Devi accedere o registrarti per scrivere nel forum
14 risposte