Soundex wydaje się być wdrożony w niektórych DBMS, ale czy były jakieś ulepszenia algorytmiczne, które są zdecydowanie lepsze niż obecna implementacja Soundex?Czy Soundex został ulepszony?
Odpowiedz
Tak. Jak wskazuje Wikipedia, jest Metafon i Double Metaphone, NYSIIS i więcej.
Należy pamiętać, że działają one wyłącznie w języku angielskim, który ma swoje szczególne problemy z ortografią. To nie jest potrzebne dla hiszpańskiego i nie ma sensu dla chińskiego/mandaryńskiego.
Nie wiem o "zdecydowanie lepszym", ale możesz chcieć spojrzeć na Metafon (i jego warianty) oraz Caverphone. Zobacz np. http://www.atomodo.com/code/double-metaphone, gdzie istnieje implementacja "Double Metaphone" do użycia z MYSQL.
Metaphone 3 to trzecia generacja algorytmu metafonowego. To zwiększa dokładność kodowania fonetycznej z 89% Double Metaphone do 98%, jak testowane na bazie najczęstszych angielskich słów, nazw i non-angielskie słowa znane w Ameryce Północnej . Zapewnia to wyjątkowo niezawodne kodowanie fonetyczne dla wymowy amerykańskiej.
Metaphone 3 został zaprojektowany i opracowany przez Lawrence Philipsa, który opracował i opracował oryginalne algorytmy Metaphone i Double Metaphone .