Il problema che stai descrivendo e' un cassico problema di Machine Learning applicato al Natural Language Processing.
Si va dal semplice (NON banale) all'estremamente complicato.
NON ESISTE un metodo unico e sicuro al 100%, per infiniti motivi che puoi ben immaginare:
1) ci sono le parolacce, in italiano ma anche in altre lingue, che possono essere usate in italiano perche' ben conosciute, il modo di scrivere le parole in cui e' ovvio il significato ma non sono scritte con i caratteri normali, ecc
2) ci sono modi di dire, i doppi sensi, le affermazioni che vogliono dire giusto il contrario (non sono un lingusta, non ricordo il termine)
3) ci sono utilizzi di parolacce in contesti che non implicano un'offesa: ad esempio se si vuole spiegare il significato di una parola offensiva, quella parola, ovviamente, viene scritta, ma non e' un'offesa.
4) ci sono i termini dialettali, ...
ecc...
Quindi non esiste LA soluzione.
Direi che questo punto hai DUE strade:
1) ti alleni in ASP.NET a fare forum (che barba, pallosissimo , giusto per usare un paio di parolacce non eccessivamente volgari ) e trascuri tranquillamente i post volgari, OPPURE
2) ti metti a studiare Machine Learning applicato al Natural Language Processing, piu' complicato, ma INFINITAMENTE piu' interessante
Puoi tranquillamente considerarlo un BEL investimento per un OTTIMO lavoro futuro.
NON c'e' da studiare giorni, ma ANNI.
Se ti inventi nuovi modi, piu' efficienti/sicuri, per identificare questo tipo di post, hai il lavoro assicurato
Per mal che vada, un posto come ricercatore all'universita'.
NON PENSARE che sia una cosa da superiori/triennale: e' robbba da dottorato di ricerca e anche piu' in la!
@oregon: non impossibile. Complicato. Si fa della sentiment-analisys con i tweet La stessa tecnica puo' essere utilizzata per dare una caratterizzazione ""offensiva"" del post