Studiuję soundex, metafonę i inne techniki wyszukiwania ciągów w ciągu ostatnich kilku dni, i według mnie oba algorytmy działają dobrze w obsłudze nie-angielskich słów transliterowanych na angielski.Włączanie soundex/metaphone dla znaków spoza alfabetu angielskiego
Jednak moim obowiązkiem jest, aby takie wyszukiwanie zadziałało w oryginalnych, nieprzetłumaczonych językach, z wykorzystaniem alfabetów takich jak niemiecki, norweski, a nawet cyrylicowy.
Czy są jakieś algorytmy wyszukiwania zdolne do obsługi tych alfabetów w całości? Czy lepiej korzystam z bibliotek wyszukiwania pełnotekstowego innych firm, takich jak Lucene? W związku z tym pojawia się pytanie "czy Lucene obsługuje alfabety nieangielskie?"
Jeśli Twój przypadek użycia jest po prostu wyszukiwaniem tekstowym w językach innych niż angielski, może nie być potrzebny soundex. Potrzebujesz Lucene z odpowiednim analizatorem, jak powiedział ire_and_curses. Jeśli chcesz obsługiwać różne warianty pisania tego samego słowa, będziesz potrzebował algorytmu dopasowania fonetycznego. Czy możesz powiedzieć coś więcej na temat swojego przypadku użycia? –