Obecnie badam systemy rekomendujące i chciałbym wiedzieć, w jaki sposób inni badacze pozyskują lub generują dane testowe do oceny wydajności systemów?Jak zdobyć lub wygenerować dane testowe dla systemu rekomendującego?
10
A
Odpowiedz
7
Nie wiem, jakie pole oceniasz, ale jeśli jest to zalecenie dotyczące filmów, możesz zacząć korzystać z MovieLens data z GroupLens. (Wygląda na to, że ich strona jest chwilowo niedostępna, ale jestem pewna, że wkrótce się jej uda).
Mają trzy zestawy danych - 100 000 głosów (preferencje), 1 milion i 10 milionów - i wygląda na to, że są mniej więcej standardem, z którego wszyscy zaczynają.
8
Kiedy pracowałem z Recommender Systems, miałem dokładnie ten sam problem. I cieszył się Grouplens DataSet najbardziej:
Można pobrać ocen podanych przez użytkowników do filmów.
też opisałem w moim blogu kilka zestawów danych znalazłem podczas badania:
http://girlincomputerscience.blogspot.com.br/2010/12/datasets.html
nadzieję, że to pomaga!
Awesome! Dzięki za informację. Co, jeśli ludzie szukają zestawu danych opartego na elementach, a nie na ocenie? NA PRZYKŁAD. Filtrowanie grupowe vs filtrowanie zawartości/filtrowanie elementów/pobieranie informacji. – user1260160
Co masz na myśli? Zestaw Grouplens może również służyć do wspólnego filtrowania. – Eyal