Salvare automaticamente pagine web

di il
40 risposte

Salvare automaticamente pagine web

L'ho postato in java perché pensavo di farlo in java ma se conoscete un altro modo è ben accetto.
C'è una specie di forum. In questo forum vengono postate delle discussioni, io vorrei che APPENA c'è una discussione nuova, entra in questa in automatico e salva subito la pagina offline.
Come posso fare?
Ho pensato di fare così: prima di tutto gli faccio analizzare il codice della pagina, ma come faccio a dire a java di andare in una determinata pagina web e prendere il codice?

aspetto che rispondiate a questa domanda poi vado avanti.
Grazie mille. ?

40 Risposte

  • Re: Salvare automaticamente pagine web

    fifififi ha scritto:


    Ho pensato di fare così: prima di tutto gli faccio analizzare il codice della pagina, ma come faccio a dire a java di andare in una determinata pagina web e prendere il codice?
    Puoi ad esempio iniziare a vedere l'uso di jsoup.
  • Re: Salvare automaticamente pagine web

    Ok... non ci sono molto, ho cliccato sul link e mi ha fatto scaricare tre file. jar e li ho scaricati. Adesso come li installo?
    Poi sono andata su netbeans e ho scritto Document doc = Jsoup.connect("link del sito che mi interessa").get();

    che devo fare?
  • Re: Salvare automaticamente pagine web

    fifififi ha scritto:


    ho cliccato sul link e mi ha fatto scaricare tre file. jar e li ho scaricati.
    Per compilazione/esecuzione serve solo jsoup-X.Y.Z.jar. Il javadoc jar è la documentazione in formato javadoc e i sources jar sono i sorgenti java se vuoi sbirciarci (o debuggare) dentro. Questi due servono più a te che alla applicazione.

    fifififi ha scritto:


    Adesso come li installo?
    In Eclipse per un normale progetto Java si va nel Build Path -> Libraries del progetto. In NetBeans sarà una cosa simile/equivalente ... non so.

    fifififi ha scritto:


    ho scritto Document doc = Jsoup.connect("link del sito che mi interessa").get();

    che devo fare?
    Una volta che hai il Document ci puoi "navigare" dentro, cercare elementi per ID, o per nome tag, iterare sui nodi figli di un nodo, ecc...
    Chiaramente devi avere un po' chiaro cosa è il DOM (Document Object Model) della pagina. Vedi esempio sul sito.
  • Re: Salvare automaticamente pagine web

    Ho aggiunto la libreria a netbeans (o almeno credo, ho seguito più o meno queste istruzioni, quello che ho capito). Adesso che le ho aggiunte posso cancellarle ? Oppure se le cancello dalla cartella d'origine non funziona più?
    Non ho capito l'ultimo messaggio che hai mandato. Non so che devo fare, c'è una qualche spiegazione?
  • Re: Salvare automaticamente pagine web

    E perché mi da errore qui?

  • Re: Salvare automaticamente pagine web

    Quale immagine?
    non si vede nulla.
  • Re: Salvare automaticamente pagine web

    Io la vedo, la riposto.




    se non vedi ancora l'immagine questo è il link https://akphoto3.ask.fm/339/079/424/-139996987-1tsqett-83tdbop1c2nbm2f/large/Untitled.jpg
  • Re: Salvare automaticamente pagine web

    Se "Jsoup" te lo segna così allora:

    a) Se non hai messo un import, chiaramente l'IDE non sa che tipo è, lo cercherebbe nel package della tua classe, dove chiaramente non c'è.

    b) Se hai messo import org.jsoup.Jsoup; e continua a segnartelo così, allora il jar di Jsoup non è stato referenziato correttamente.
  • Re: Salvare automaticamente pagine web

    Fra l'altro stai attento all'oggetto "Document"
    Perché potrebbe essere di tipo javax.swing.text che nel tuo caso è sbagliato.
    Dovresti fare l'import di org.jsoup.nodes.Document che è il tipo di oggetto accettato dal metodo get del JSoup.
  • Re: Salvare automaticamente pagine web

    andbin ha scritto:


    b) Se hai messo import org.jsoup.Jsoup; e continua a segnartelo così, allora il jar di Jsoup non è stato referenziato correttamente.
    beh allora non ho capito come fare a referenziarlo correttamente.
  • Re: Salvare automaticamente pagine web

    fifififi ha scritto:


    beh allora non ho capito come fare a referenziarlo correttamente.
    Puoi leggere http://stackoverflow.com/questions/7598623/how-to-setup-classpath-in-netbeans

    E se è basato su Maven, le "coordinate" Maven di JSoup le trovi sul sito di JSoup sezione download.
  • Re: Salvare automaticamente pagine web

    Ho fatto adesso segna errore in tutto questo codice
    Document doc = Jsoup.connect("https://www.google.it/webhp?hl=i").get();
  • Re: Salvare automaticamente pagine web

    Ma cosa intendi fare precisamente? A cosa ti serve? Se spieghi meglio la situazione magari possiamo trovare altre soluzioni
  • Re: Salvare automaticamente pagine web

    Java.Addicted ha scritto:


    Ma cosa intendi fare precisamente? A cosa ti serve? Se spieghi meglio la situazione magari possiamo trovare altre soluzioni
    il fatto è che preferirei tenerlo segreto...
    perché c'è errore nel codice?
Devi accedere o registrarti per scrivere nel forum
40 risposte