Vyhľadávanie názorového spamu

Klasifikovanie dokumentov do tried pomocov Bayesovho klasifikátora.

Trenovacie data

Data musia byť dvojice komentár a vysledná hodnota (1 = je spam, -1 = nie je spam).

Môžete použiť niektoré z dát zo stránky http://personalwebs.coloradocollege.edu/~mwhitehead/html/opinion_mining.html. Algoritmus potom bude rozlišovať kladné komentáre od záporných. Ak by sme chceli aby vyhľadával spam, bolo by potrebné manuálne prepísať hodnoty pri všetkých dátach.

Komentár na otestovanie