CERCARE TESTO IN PDF

di il
7 risposte

CERCARE TESTO IN PDF

Salve a tutti..!!
Sto cercando di creare un piccolo programma che tramite codice cerca parole in file PDF....
mi spiego meglio , ho un file PDF e vorrei sapere se al suo interno è contenuta una parola es.MIA PAROLA, se c'è il programma tramite una msgbox mi
avvisa della presenza altrimenti mi restituisce sempre tramite msgbox "MIA PAROLA NON PRESENTE"
Qualcuno ha gia' fatto qualcosa del genere o ha idea di come si possa fare..??

Grazie a tutti in anticipo..!!

7 Risposte

  • Re: CERCARE TESTO IN PDF

    Usa la libreria iText7: https://github.com/itext/itext7-dotne
  • Re: CERCARE TESTO IN PDF

    visualrate ha scritto:


    Sto cercando di creare un piccolo programma che tramite codice cerca parole in file PDF....
    A meno che tu non abbia voglia di studiare il formato dei file PDF e gestire la cosa autonomamente, ti serve una libreria adatta allo scopo, come XPdfText, oppure interagire con un tool che estragga le informazioni al posto tuo, tipo XPdfReader.

    Ciao!
  • Re: CERCARE TESTO IN PDF

    Grazie a tutti per la vostra solita disponibilità..!!
    allora ho capito che ci sarebbe bisogno di una libreria esterna....OK installo iText7 e poi..??
    Potete indirizzarmi con qualche riga di codice..??
    non saprei quali istruzioni usare per far leggere tutto il testo contenuto per poi confrontarlo con la MIA PAROLA attraverso vabbe if......
    Grazie ancora davvero....
  • Re: CERCARE TESTO IN PDF

    Ma scusa, basta navigare due secondi nei link che ti hanno dato e gli snippet li trovi in bella mostra

    http://itextpdf.com/en/products/itext-7/itext-7-cor
    http://www.glyphandcog.com/XpdfText.htm
  • Re: CERCARE TESTO IN PDF

    Ma nei Link postati mi sembra di leggere come convertire PDF in testo....
  • Re: CERCARE TESTO IN PDF

    visualrate ha scritto:


    Ma nei Link postati mi sembra di leggere come convertire PDF in testo....
    Appunto!
    Quando hai il testo cerchi la parola, in VB .Net c'è la comoda istruzione Contains:
            Dim ParolaDaCercare As String = "parola"
          
            If TestoDaPDF.Contains(ParolaDaCercare) Then
                MessageBox.Show(ParolaDaCercare & Environment.NewLine & "c'è")
            Else
                MessageBox.Show(ParolaDaCercare & Environment.NewLine & "non c'è")
            End If
    Attenzione al case sensitive, Contains cerca il testo considerando diverse le maiuscole e le minuscole, per ovviare al problema:
            Dim ParolaDaCercare As String = "Mario"
          
            If TestoDaPDF.ToUpper.Contains(ParolaDaCercare.ToUpper) Then
                MessageBox.Show(ParolaDaCercare & Environment.NewLine & "c'è")
            Else
                MessageBox.Show(ParolaDaCercare & Environment.NewLine & "non c'è")
            End If
    Se il documento PDF contiene molto ma molto testo, convertire tutto in maiuscolo, può rallentare il processo, con IndexOf hai anche la posizione della prima occorrenza:
            Dim ParolaDaCercare As String = "Mario"
           
            Dim Pos As Integer = TestoDaPDF.IndexOf(ParolaDaCercare, StringComparison.OrdinalIgnoreCase)
    
            If Pos > -1 Then
                MessageBox.Show(ParolaDaCercare & Environment.NewLine & "TROVATO, in posizione " & Pos.ToString())
            Else
                MessageBox.Show(ParolaDaCercare & Environment.NewLine & "non c'è")
            End If
  • Re: CERCARE TESTO IN PDF

    Grazie per la tua esaustiva risposta..!!
    Adesso tiro giù un po’ di codice sperando di ottenere il risultato....
    Garanzie ancora a tutti..!!
Devi accedere o registrarti per scrivere nel forum
7 risposte