Di sicuro stai facendo un pasticcio.
Avere 2 versioni di python e' un disastro.
Il machine learning applicato al linguaggio naturale non e' esattamente un argomento da studiare a suon di link su Internet. Ci sono testi abbastanza 'tosti' su cui basarsi.
Oltre al fatto che uno dovrebbe masticare anche statistica e algebra lineare.
Per fare qualcosa, comunque, devi creare un ambiente di sviluppo senza pasticci.
Disinstalla TUTTO, fai pulizia METICOLOSA. Se non lo sai fare, fatti aiutare.
Installa Anaconda Python 3 (a 64 bit!) e Pycharm comunity edition, e poi cerca, sempre sul sito di Anaconda, come installare le rimanenti librerie. Fatti aiutare!
Devi avere hardware adeguato! Non il pc della nonna. Non sto parlando di data di acquisto, ma di 'potenza computazionale' (cpu 2ghz, i5 o i7 o equivalenti AMD) , memoria (16gb), e capacita' di archiviazione (disco capiente). E sistema operativo a 64 bit (Windows 7.. 10 o una buona distribuzione Linux). Ovviamente, 'di piu' E' MEGLIO.
Per il resto, concettualmente, word2vec e' semplice da capire (sempre se uno ha chiaro un bel po' di concetti base) : e' un metodo di 'dimention reduction' (uno dei tanti metodi di 'word embedding') che mappa lo spazio a n-mila dimensioni delle parole in uno spazio mooolto piu' piccolo (qualche centinaio di dimensioni).
A questo punto, poiche ogni parola diventa un vettore, la distanza tra 2 parole e' calcolata come la distanza tra 2 vettori.
Una possibile distanza e' il prodotto scalare, il quale puo' essere scritto come: 'mod(v1) *mod(v2) *cos(alpha)' dove alpha e' appunto, l'angolo. Se 'mod(v) =1', ecco che il prodotto scalare non e' altro che 'cos(alpha)'.
Se 'cos(alpha)' e' circa 1, le due parole sono molto simili (bella, carina) , se circa 0, non hanno relazione (ragazza, sfera), se circa -1 sono antitetiche (simpatica, antipatica).
Ricorda: NIENTE' e' 'magico'. Se sembra troppo bello per essere vero, NON E' VERO!
Di rogne ne troverai tante (parole che 'dovrebbero' essere simili ma che non lo sono, ...). La conoscenza della materia ti permeterebbe di ovviare in modo intelligente a tali problemi. Ma tocca STUDIARE .
Per i LIBRI e' facile: cerchi 'nlp python' (e termini simili: 'nltk', 'natural language processing', ecc) su Amazon e ne trovi un bel po'. Quelli della o'reilly sono ottimi (o, in generale, molto buoni). Quelli della packt non mi piacciono, sono qualitativamente inferiori, ma se non c'e' altro ...
Poi ti serve un buon libro su python e conoscere i concetti di programmazione. Amazon, Oreilly!
NO italiano
NO link su internet
LIBRI!!!!