Pracuję nad analizą nastrojów i używam zestawu danych podanego w tym linku: http://www.cs.jhu.edu/~mdredze/datasets/sentiment/index2.html
i podzieliłem mój zbiór danych na proporcje 50:50. 50% stosuje się jako próbki testowe, a 50% stosuje się jako próbki pociągu, a cechy ekstrahuje się z próbek pociągów i wykonuje klasyfikację z zastosowaniem klasyfikatora Weka, ale moja dokładność predykcyjna wynosi około 70-75%.Dobry zestaw danych do analizy sentymentów?
Czy ktoś może zasugerować kilka innych zestawów danych, które mogą mi pomóc, aby zwiększyć wynik - użyłem unigram, bigram i POStags jako moje funkcje.
Możesz spróbować tego https://www.kaggle.com/data/36745#latest-205286 – Seremonia