Parsing HTML in java

di il
1 risposte

Parsing HTML in java

Ciao a tutti!!!

Ho da poco imparato a fare il parsing dell' xml ma ora mi tocca fare la stessa cosa ma con delle pagine in html.Naturalmente la difficoltà non è la stessa soprattutto per come sono gestiti i vari tag e per gli eventuali "errori".

Il parser che utilizzo è fatto per l' xml va comunque bene per l' html?

Se ho delle linee di codice html del tipo:

.........

.........

<!--New Nearby-->
<div id="w-nrbylocations" class="wmod">
<div class="hd"><h3>Nearby Locations</h3></div>
<div class="bd clearfix">
<ul>
<li><a href="/forecast/ITXX0055.html">Palermo</a></li>
<li><a href="/forecast/ITXX0077.html">Trapani</a></li>
<li><a href="/forecast/ITXX0114.html">Castelvetrano</a></li>
</ul><ul class="last">
<li><a href="/forecast/ITXX0038.html">Marsala</a></li>
<li><a href="/forecast/ITXX0111.html">Caltanissetta</a></li>
<li><a href="/forecast/ITXX0191.html">Gela</a></li>
</ul>
</div>
</div>
<!--END Nearby-->

.......

.......

dove ciò che mi interessa è estrarre le 6 città tra <ul> e </ul> come posso fare?Naturalmente di <ul> ci sono diversi tag in tutto il file.Datemi dei consigli su che parser HTML utilizzare e magari come poter parsare i dati che vi ho descritto.

Vi ringrazio di tutto!!!

1 Risposte

Devi accedere o registrarti per scrivere nel forum
1 risposte