2013-07-15 21 views
5

Mam biegać nutch robota jak na nutch tutorialu http://wiki.apache.org/nutch/NutchTutorial ale kiedy zacząłem ładuje go do SOLR otrzymuję tę wiadomość ie „Brak IndexWriters aktywowany - Sprawdź konfiguracjęNutch komunikat „Brak IndexWriters aktywna” podczas ładowania do SOLR

bin/nutch solrindex http://localhost:8983/solr crawl/crawldb/ -dir crawl/segments/ 
Indexer: starting at 2013-07-15 08:09:13 
Indexer: deleting gone documents: false 
Indexer: URL filtering: false 
Indexer: URL normalizing: false 
**No IndexWriters activated - check your configuration** 

Indexer: finished at 2013-07-15 08:09:21, elapsed: 00:00:07 

Odpowiedz

7

Upewnij się, że wtyczka indexer-solr jest dołączona. Przejdź do pliku: conf/nutch-site.xml i mienia plugin.includes dodać plugin, na przykład:

protokół HTTP | URLFilter-regex | parse- (html | tika) | indeksowanych (podstawowy | kotwica) | indexer- solr | punktacji-OPIC | urlnormalizer- (przesuń | regex | podstawowy)

Po dodaniu wtyczki ostrzeżenie No IndexWriters activated - check your configuration zniknęła w moim przypadku.

zobacz ten wątek: http://lucene.472066.n3.nabble.com/a-plugin-extending-IndexWriter-td4074353.html

+0

Dzięki @Tkiewele, ale już to mam. –

+0

I to nie działa ... –

+0

Spóźnieni na imprezę, ale dla każdego, kto mnie polubił, pamiętaj o zaktualizowaniu pliku nutch-site.xml w folderze runtime/local/conf /, nie tylko w conf /. – Scott101

0

Nie wiem, czy jest to nadal problem, ale miałem ten problem i wtedy zrozumiałem, że mój src/plugin/build.xml brakowało wtyczki indexer-solr. Dodanie następujących po czym rekompilacji nutch ustalone to dla mnie:

<ant dir="indexer-solr" target="deploy"/>

0

Dodaj właściwość poniżej w conf/nutch-site.xml dla wtyczki

<property> 
<name>plugin.includes</name> 
<value>protocol-httpclient|urlfilter-regex|index-(basic|more)|query-(basic|site|url|lang)|indexer-solr|nutch-extensionpoints|protocol-httpclient|urlfilter-regex|parse-(text|html|msexcel|msword|mspowerpoint|pdf)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)protocol-http|urlfilter-regex|parse-(html|tika|metatags)|index-(basic|anchor|more|metadata)</value> 
</property> 

Daj mi znać, jeśli to rozwiązuje problemu .

2

@Tryskele + @ Scott101 pracował dla mnie:

dodać plugin.includes nieruchomość zarówno /conf/nutch-site.xml i uruchomieniowych/local/conf/plików siatkowe-site.xml:

<property> 
    <name>plugin.includes</name> 
    <value>protocol-httpclient|urlfilter-regex|index-(basic|more)|query-(basic|site|url|lang)|indexer-solr|nutch-extensionpoints|protocol-httpclient|urlfilter-regex|parse-(text|html|msexcel|msword|mspowerpoint|pdf)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)protocol-http|urlfilter-regex|parse-(html|tika|metatags)|index-(basic|anchor|more|metadata)</value> 
</property>