Próbuję zbudować system rekomendujący, który polecałby strony internetowe użytkownikowi na podstawie jego działań (wyszukiwanie google, kliknięcia, może również jawnie oceniać strony internetowe). Aby uzyskać pomysł w taki sposób, w jaki robią to wiadomości google, wyświetla on artykuły z wiadomości na dany temat. Pod względem technicznym to klastrowanie, ale mój cel jest podobny. Będzie to zalecenie oparte na treści na podstawie działania użytkownika.System rekomendacji strony internetowej
Więc moje pytania to:
- Jak mogę ewentualnie włoka z Internetu w celu znalezienia stron internetowych związanych z?
- A jaki algorytm należy użyć do wyodrębnienia danych ze strony internetowej to tylko analiza tekstowa i częstotliwość słów?
- Wreszcie, która platforma najlepiej nadaje się do tego problemu. Słyszałem o mahoutach Apache i pochodzi z algosami wielokrotnego użytku, czy to brzmi jak dobre dopasowanie?
Można napisać wiele książek o pytania. –
haha, czy brzmią jak duże problemy? Cóż, szukam prostego rozwiązania. Tylko krótki opis, jak podejść do takiego projektu. –
[Programowanie wywiadu kolektywnego] (http://shop.oreilly.com/product/9780596529321.do) to prosty, bezk matowy wstęp do uczenia maszynowego i zawiera przypadek użycia, jak na przykład twoje pytanie. – Maurits