@gian82, un server sa UNA VALANGA DI COSE su di te per un motivo moooolto semplice:
NON E' SOLO l'ip da cui parte la connessione
NON SONO SOLO gli header che mandi ogni volta che fai la connessione,
MA
SEI TU, con il tuo comportamento UNICO, ATTUALE e PASSATO nei confronti di quel server che le fornisci: a che ora ti colleghi, per quanto tempo rimani connesso, quali sono le pagine che visiti, quali link segui
cioe' TUTTA LA TUA INTERAZIONE con il server stesso o con altre entita' a cui il server e' in qualche modo ‘federato’ (un'altro sito a cui tu passi ALTRE informazioni).
NON SOLO di quella sessione, ma anche di tutte le sessioni passate.
Perche' pensi che Google sborsi 60 milioni di $ all'anno a Reddit? Perche' sono di manica larga? ;-)
Faccio un esempio: vai su un sito di vendita di scarpe per cercare il tuo nuovo paio di scarpe.
Dal tipo di scarpe che cerchi (modello, colore, prezzo, numero), o che scarti (rimani sulla pagina troppo poco tempo) perche' banalmente non ti fermerai al PRIMO modello che ti capita, dalla velocita' con cui interagisci con il sito, con le parti del sito con cui interagisci o con le parti del sito con cui NON interagisci, sanno il tuo sesso, l'eta', l'altezza, una stima del tuo conto in banca, il tuo lavoro, una stima di dove abiti, una stima degli abiti che indossi ed ininfinita' di altre cose (carattere? orientamento sessuale? colori preferiti? se ti distrai facilmente? se preferisci le bionde, le brune o le rosse? … ;-) )
Se poi questo lo agganci al fatto che questi dati vengono integrati con i dati di altri siti, probabilmente riescono a trovare anche via, numero civico e piano ;-)
Da li a sapere chi sei esattamente e' un attimo! ;-)
Da questo punto di vista, Amazon e' una “potenza” offrendo una “valanga” di prodotti mediante il quale, in base alle tue ricerche, puo' “profilarti”. Stessa cosa per Google, visto che osserva TUTTE le tue ricerche ed ha accesso anche ai servizi che tu usi ;-)
Altro esempio: ti sei registrato su due siti differenti con nominativi differenti.
Ok, ma quando ti colleghi, hai un IP che per quella sessione non cambia. Quindi se nella stessa sessione ti colleghi ad entrambi i siti, c'e' una corrispondenza tra stesso IP, stesse ore per due utenti diversi.
Se avviene una sola volta, identificare la corrispondenza e' complicato, MA se capita molte volte, la corrispondenza diventa certa, alias: BECCATO! Ha due nominativi ma sei sempre tu!
Questa e' la potenza del machine learning.
Se poi ci metti vicino anche un bel po' di reinforcement learning (trovare quale combinazione di stimoli e' la migliore per ottenere un certo risultato) , in un futuro non troppo lontano si potra' comandare il comportamento delle masse a tavolino ;-)
Pensa al film “Focus - Niente è come sembra” (con Will Smith) in cui i truffatori fanno vedere per tutto il giorno all'obiettivo un certo numero. Quando fanno la scommessa, praticamente sanno gia' che il truffato scegliera' esattemente quel numero ANCHE SE LUI PENSA di esserselo inventato li per li ;-)