Riguardo la fase di cattura della risposta http trovi tutto il necessario nel link nella risposta precedente.
Fatto ciò, devi isolare il corpo della richiesta (è puoi farlo in vari modi, dal momento che la risposta http è semplicemente un testo con una struttura ben definita), e poi navigare nella struttura della pagina html (il DOM) selezionando dapprima la tabella e poi ciclando sulle righe.
Qui potresti trovare dei suggerimenti utili: , ma cercando su google puoi trovare anche varie librerie php che ti semplificano la vita.
Dal momento che non puoi sapere a priori quando avvengono delle modifiche nel sito remoto (anche perché solitamente il codice html non finisce nella cache, altrimenti potresti ricavare "in automatico" quest'informazione), ti converrebbe avere un loop infinito con degli sleep in modo da campionare il sito ogni tot tempo, e poi inserire i dati nel database scartando i duplicati. Però php blocca l'esecuzione dello script se questa dura più di 30 secondi, quindi devi settare opportunamente la variabile max_execution_time nel file di configurazione php.ini.
Prova a informarti su tutte queste tecnologie su google e prova a scrivere del codice, poi al massimo torni qui a chiedere aiuto.
ciao