Il mio materiale di studio sono i vari articoli accademici presenti su internet.
La libreria python che sto utilizzando al momento è: re, nltk, che è una suit di librerie adatte alla elaborazione del linguaggio naturale. Per l'analisi del linguaggio naturale occorre però fare determinate osservazioni per evitare di incorrere nel fenomeno del disambiguation:
esempio: mouse --> topo ma anche mouse --> periferica di imput
Il testo prima di essere passato all'analisi deve essere sottoposto al preprocessing: tokenization, POStagging, reduce text to nouns, adjectives, verbs, adverbs (optionally filtering out named entities), normalization: stemming and/or lemmatization; e successivamente costruire il corretto algoritmo per una corretta analisi.
Quello che è essenziale di sentiwordnet è:
i punteggi sentimentali hanno valori compresi tra 0 e 1;
sentiwordnet assegna punteggi a nomi,verbi, aggettivi;
Pos_Score + Neg_Score+ Objective_Score = 1;
importo la libreria from nltk.corpus import sentiwordnet as swn per il mio progetto
manca un idea algoritma per implementarlo adesso