Jaka jest maksymalna liczba instancji przeszukiwacza Apache Nutch, które mogą być uruchomione w tym samym czasie z jednym węzłem głównym?Maksymalna liczba instancji modułu roboczego Apache
7
A
Odpowiedz
1
Nie jest jasne, co rozumiesz przez instancje przeszukiwacza. Jeśli chcesz uruchomić skrypt indeksowania kilka razy równolegle, np. masz różne indeksowania z oddzielnymi konfiguracjami, nasionami itp., a następnie będą rywalizować o gniazda w klastrze Hadoop. Następnie sprowadzi się do liczby dostępnych szczelin map/reduktorów w twoim klastrze, która zależy od liczby niewolników.
Obsługa wielu przeszukiwań Nutch równolegle może być bardzo trudna i nieefektywna pod względem zasobów. Zamiast tego ponownie przemyśl swoją architekturę, aby wszystkie logiczne roboty indeksujące mogły działać jako jeden fizyczny model lub spójrz na StormCrawler, co powinno być lepszym rozwiązaniem.