Ciao a tutti ragazzi,
mi chiamo Alessandro e sono un neofita della programmazione, essendomi avvicinato a tale "universo" (chiamarlo "mondo" sarebbe probabilmente riduttivo) a 34 anni suonati e dopo essere comunque sempre stato uno abbastanza "smanettone" in informatica, sin da bambino. Approfitto quindi del presente post presentarmi e salutarvi tutti, certo che avremo occasione di condividere insieme la nostra comune passione tra le pagine di questa community!
Venendo all'oggetto del thread, sto realizzando uno (anzi due, e qui è il problema... ora ci arrivo) script in Python per web scraping con l'obiettivo di ottenere un programma che permetta, a fronte di uno specifico url dato in input dall'utente, di estrarre alcune specifiche informazioni dalla relativa pagina web.
Facendo degli esempi puramente generici, immaginiamo che io voglia estrarre dal sito della Azienda1 alcune informazioni contenute nelle singole pagine di ogni film prodotto dalla casa cinematografica, come ad esempio titolo del film, nome del regista, anno d'uscita, durata del film, budget, incasso totale, etc.
Queste informazioni, all'interno di ogni pagina relativa ad ogni singolo film sono contenute in specifiche sezioni della pagina e lo script "Azienda1 script" funziona egregiamente.
Ora, immaginiamo che la stessa cosa voglia farla anche per il sito della Azienda2, sempre web scraping per le stesse informazioni tratte anche in questo caso dalle singole pagine dei singoli film il cui url viene dato di volta in volta manualmente dall'utente. La struttura del sito della Azienda2, ancorché riportante tutte le informazioni che voglio acquisire, è completamente diversa da quella del sito della Azienda1, conseguentemente lo script "Azienda2 script", che anch'esso funziona egregiamente, riesce però a lavorare solo sul sito della Azienda2, come lo script "Azienda1 script" vi riesce solo su quello della Azienda1.
La mia domanda è: come unisco i due script in uno solo creando una condizione, a valle dell'url dato in input dall'utente, tale per cui se inserisco un url relativo al sito della Azienda1 mi esegua la funzione Azienda1() mentre se inserisco un url del sito Azienda2 mi esegua la funzione Azienda2() ?
Vi preciso che la sintassi dei due url è, sempre a titolo esemplificativo:
- dominio/movies/codice/ (Azienda1)
- dominio/film/codice/ (Azienda2)
Grazie in anticipo a tutti voi.