Pracuję z Double Metaphone i Caverphone2 dla porównania String i działają dobrze na takich rzeczach, jak nazwiska, adresy, itp. (Caverphone2 działa najlepiej dla mnie). Jednak produkują zbyt wiele fał
Mam kompilacje mieszane spamsum dla około dziesięciu milionów plików w tabeli bazy danych i chciałbym znaleźć pliki, które są rozsądnie podobne do siebie. Spamsum skróty składają się z dwóch mieszań C
Załóżmy, że mamy tabelę osób (imię, nazwisko, adres, numer SSN itp.). Chcemy znaleźć wszystkie wiersze, które są "bardzo podobne" do określonej osoby A. Chciałbym zaimplementować pewnego rodzaju porów
Używam dopasowania rozmytego w moim projekcie, głównie w celu znalezienia błędów pisowni i różnych pisowni tych samych nazw. Muszę dokładnie zrozumieć, w jaki sposób sprawdza się rozmyte dopasowanie e
Czy istnieje biblioteka podobna do Pythona difflib na Ruby? W szczególności potrzebuję takiego, który ma metodę podobną do difflib.get_close_matches. Wszelkie zalecenia?
W mojej pracy z doskonałymi wynikami używam algorytmów dopasowywania przybliżonych ciągów, takich jak odległość Damerau-Levenshtein, aby mój kod był mniej podatny na błędy ortograficzne. Teraz muszę d