2012-11-05 4 views
5

Używamy Solr 3.6 w konfiguracji master-slave, 100 s rdzeni, 100s milionów dokumentów i potrzebujemy całodobowego czasu pracy. Chcemy dokonać aktualizacji do wersji Solr 4.0.Migrowanie Solr od 3.6 do 4.0, metoda to zrobić, i czy jest to bezpieczne?


wierzę poprawna metoda jest zrobić plików skopiować starych indeksów do nowej lokalizacji i konfiguracji SolrConfig z:

<luceneMatchVersion>LUCENE_33</luceneMatchVersion> 

Pytanie 1: To sprawi Solr korzystania przestarzały format? Czy to przekształci indeks do formatu 4.0 w trybie online?


Pytanie 2: Czy istnieje lepsza metoda, która wymaga mniejsze przestoje przekształcić indeksy? Czy mogę replikować ze starego serwera na nowy?


Pytanie 3: A może ktoś potwierdzić jeżeli Solr 4.0 jest bezpieczny tak intensywnego użytkowania jak nasza?

Odpowiedz

0

Co powiesz na uruchamianie obu wersji Solr 3.6 i 4.0 na każdym komputerze (oczywiście różne porty), abyś mógł je wypróbować i wycofać, jeśli zajdzie taka potrzeba?

1

Jeśli trzymać

<luceneMatchVersion>LUCENE_33</luceneMatchVersion> 

zamiast używać:

<luceneMatchVersion>LUCENE_40</luceneMatchVersion> 

nie dostaniesz pełne korzyści z Solr 4/Lucene 4. Jednakże nie można przełączyć do LUCENE_40 bez odbudowy wszystkich indeksów . Jeśli pozostaniesz z LUCENE_33, nadal będzie używać starego formatu indeksu.


W przypadku pytania 2, jeśli masz wystarczającą ilość zasobów, skonfiguruj drugą instancję Solr i skopiuj indeksy do Solr4. Można to zrobić, pisząc program Java z SolrJ. Nie jestem pewien żadnych istniejących tam, ale prawdopodobnie są.

Zaleta: możesz to zrobić na żywo.

Wada: nie działa dobrze, jeśli instancja Solr 3 jest stale aktualizowana.

Jeśli masz pola datownika, który rejestruje datę/godzinę każdy rekord został zaktualizowany, podobny do następującego:

<field name="timestamp" type="date" indexed="true" stored="true" default="NOW" multiValued="false"/> 

może to być łatwiejsze, ponieważ kiedy czytasz można wykonać kwerendy, gdzie datownik jest mniejsza niż bieżąca data, której wyniki są mniej prawdopodobne, zmienia się w trakcie iteracji wyników (choć nie jest to niemożliwe, jeśli istniejące zapisy są aktualizowane lub usuwane).


Od ponad czterech miesięcy korzystamy z Solr 4.0 bez problemów. Jest to pojedynczy rdzeń Solr, który ma 150 milionów dokumentów.