Nieco bardziej swoistość dokładną problemu byłoby dobre. Istnieje wiele różnych technik, z których możesz korzystać. Wiele z nich jest napędzanych przez inne dane. Możesz oczywiście użyć Lucene i zbudować własne indeksy. Dla lucenu istnieją wiązania dla wielu języków. Przeniesienie tam jest również projektem Solr, który jest Lucene z wieloma narzędziami i dodatkową funkcjonalnością wokół niego. To może być bardziej zgodne z tym, czego szukasz.
zamiarem jest trudne i większość współczesnych wyszukiwarek opierają się na statystycznej zamiarem, aby pomóc w uporządkowaniu wyników. Zawsze możesz mieć przycisk przydatny w tym artykule i przechowywać tekst zapytania, który prowadzi do przydatnych dokumentów. Następnie można dodać warstwę informacji do indeksu, aby zwiększyć konkretne słowa lub wyrażenia i pomóc im wskazać określone dokumenty.
Kilka rzeczy do przemyślenia ... Ile dokumentów? Jaka jest średnia długość? Czy są one często aktualizowane? Co użytkownicy robią z dokumentami? Jak wygląda upowszechnianie się unikalnych słów w dokumentach? (Mówiąc prościej jest to łatwo dopasować zapytanie z konkretnego dokumentu (ów) w oparciu o wspólne unikalnych cech.)
Jeśli jest w internecie można zawsze wykonać własną wyszukiwarkę Google, która właśnie przeszukuje witryny chociaż może z tego powodu być nieoptymalnym z wielu powodów.
Zawsze można zacząć od prostego indeksu i stopniowo stał się bardziej wyrafinowany od rozmowy z użytkownikami i przechwytywania danych.