Robię projekt w klasyfikacji wiadomości. Zasadniczo system będzie klasyfikował artykuły informacyjne w oparciu o wstępnie zdefiniowany temat (np. Sport, polityka, międzynarodowe). Aby zbudować system, potrzebuję darmowych zestawów danych do szkolenia systemu.Nowości Zestawy danych artykułów
Do tej pory, po kilku godzinach wyszukiwania google i linków z here jedynymi odpowiednimi zestawami danych, jakie mogłem znaleźć, jest this. Choć mam nadzieję, że to wystarczy, myślę, że spróbuję znaleźć więcej.
Zauważ, że zestawy danych chcę:
- Zawiera pełne artykuły prasowe, a nie tylko tytuł
- jest w języku angielskim
- w formacie .txt, a nie XML lub db
Czy ktoś może mi pomóc?
Tak, próbuję znaleźć zbiór danych, ponieważ będę zajęty projektem, więc staram się ograniczyć rzeczy do zrobienia. Ponadto nie wiem, jak napisać skrypt w Pythonie/Perlu/PHP. – Hearty