dvaosta ha scritto:
Non sono pochi spiccioli, sono 0 spiccioli.
Se lo modifichi in modo da riconoscere le email in un documento generico (ovvero senza cercare un tag in una pagina web con una certa struttura) magari ci fai 1 spicciolo.
Se invece di fare un raccoglitore di email crei un bot che visitando pagine generiche cerca dei contenuti secondo delle regole imposte dall'utente e magari fa del data mining (esempio: cerca delle pagine web in cui si fa riferimento a delle persone, capisci di cosa parlano queste pagine, cerca di determinare gli interessi di ogni persona (il che è molto complicato (omonimie, errori di battitura, ecc.), e in generale dovrai lavorare approssimando, scartando una discreta percentuale di dati e isolando i profili outliers) e magari estrae delle association rules, allora magari ci puoi fare degli spiccioli. Ma ne vale la pena? Hai già un lavoro che suppongo ti tenga abbastanza impegnato, ha senso imbarcarsi in un progetto di alcuni mesi che magari poi, anche se buono, non riesci a vendere (perché comunque bisogna anche far conoscere il proprio prodotto)?
Stiamo un po dilagando, lo scopo è trovare mail pubblicate e quindi accessibili a tutti senza sbattersi cercandone una ad una limitandosi a comuni o province specifiche.
È una piccola utility che ti risparmia del tempo che al momento con i dati forniti non saprei, umanamente, trovarne di più.
In ogni caso non utilizzo tag mirati.
Ovvio che potrei utilizzare altre mille parole chiavi ma comincia a diventare anche un problema di ricerca a quel punto. Dovrei affidarmi ad un sistema di web search a pagamento e non ne vedo il motivo al momento.