Non esiste LA SOLUZIONE UNIVERSALE/MIRACOLOSA.
Se hai 7/8 formati diversi di tabelle, dovrai implementare 7/8 programmini diversi.
In ogni caso, il sistema per fare il lavoro e' sempre lo stesso:
1) parser DOM per leggere la pagina HTML: se non funziona perche' la pagina e' malformata, correzione a mano degli errori!
2) uso di XPath per selezionare il nodo di interesse: dovrai trovare il modo di capire, in automatico, quale dei 7/8 formati di tabella stai trattando. Se ci sono degli errori -> correzione a mano
3) Salvi tutto su un file CSV, e poi controlli a mano il risultato.
4) Se ti sembra tutto corretto, lettura del CSV e caricamento sul database.
Altrimenti: correzioni a mano e si ricomincia.