Widzę różne kombinacje wersji Nutch i Solr używane przez osoby publikujące na ten temat w Internecie. Jakie są najnowsze stabilne (nie beta) i kompatybilne wersje Nutch i Solr, które mogę pobrać i skonfigurować bez budowania źródeł i po prostu konfigurowania?Najnowsze kompatybilne wersje Nutch i Solr
Odpowiedz
Możesz użyć Nutch 2.1 lub Nutch 1.6. Jeśli chcesz używać HBase, musisz użyć Nutch 2.x. Ponieważ Nutch 1.6 nie obsługuje Hbase. Używam nutch 2.1, HBase 0.90.x lub 0.94.5 i Solr 4.3.0.
Istnieją poważne zmiany między dwiema wersjami Solr (Solr 3.x i Solr 4.x). Musisz wybrać jedną z nich zgodnie z wymaganiami. Np: lepiej Solr4 support cloud
.
Z jakiego systemu operacyjnego korzystasz?
W systemie Windows Nutch 1.2 była najnowszą wersją, którą udało mi się uzyskać.
W systemie Linux Nutch 1.6 działa bardzo dobrze z SOLR.
To było w połączeniu z SOLR 3.5 (z powodu innych zależności), ale nie ma powodu, aby nie działał z SOLR 3.6 lub 4.3.
I wdrożone nutch 1.6 i Solr 3.6.2 do systemu produkcyjnego na początku tego roku w dużej firmie finansowej. Działają bardzo dobrze razem.
użyłeś Tomcat lub Jetty dla Solr? – MarioCannistra
Użyłem obu, aw obu przypadkach są one proxy przez Apache. – Claude
Cześć Claude. Czy kiedykolwiek próbowałeś Nutch 2.2.1 z HBase w systemie produkcyjnym? – sunskin
Oto kilka sugerowanych kompatybilne wersje Nutch i Solr w oparciu o to, co twórcy w nutch są ogłoszeniu na ich stronie internetowej here:
+-------+--------+
| Nutch | Solr |
+-------+--------+
| 2.3.1 | 4.10.3 |
| 2.3 | 4.8.1 |
+-------+--------+
Zapraszam do dodawania kolejne wersje. Narzędzie używane do wygenerowania tej tabeli można znaleźć here.
używam -
- Apache nutch 2.3.1
- Solr 5.2.1
- HBase 0.94.14
A to połączenie działa poprawnie!
Używam Ubuntu Server 12.04 LTS. Po prostu próbowałem SOLR 4.3.0 i Nutch 1.6. Oba działają (Solr działający w Tomcat i Nutch pomyślnie przeszukał małą witrynę). Po uruchomieniu polecenia solrilindex Nutch w celu zintegrowania ich i indeksowania przeszukiwanej witryny za pomocą solr, otrzymałem zadanie java.io.IOException Job nie powiodło się! błąd. Brak dalszych szczegółów w dziennikach solr lub nutch. Zastanawiam się, czy może to wynikać z niekompatybilności między dwiema wersjami ... – MarioCannistra
Wersja Tomcat to 7 – MarioCannistra
Plik hadoop.log zwykle zawiera więcej szczegółów. Czy możesz opublikować ślad stosu błędu? Jeśli nie ma więcej szczegółów, spróbuj zmienić conf/log4j.properties i zmienić poziomy debugowania z INFO na DEBUG – nimeshjm