2009-06-09 13 views
14

szukam implementacji Java ogólnego sufiksu Tree (GST) z następującymi funkcjami:Uogólnione przyrostek Drzewo Java Realizacja

po stworzeniu GST z powiedzmy 1000 strun chciałbym dowiedzieć się, ilu te 1000 ciągów zawiera inne ciągi 's'.

Wyszukiwanie musi być cichy szybko, jak trzeba zastosować wyszukiwanie na około 100'000 ciągów kandydujących średniej długości 10.

+0

Witam, zastanawiałem się, czy mógłbyś mi powiedzieć, której duszy użyłeś w końcu, mam ten sam problem !!! – Julia

+0

zobacz tutaj: http://stackoverflow.com/questions/9452701/ukkonens-suffix-tree-algorithm-in-plain-english/9513423#9513423 – YAMM

Odpowiedz

4

Zajrzyj The Semantic Discovery Toolkit. Ma implementację na text/src/Java/org/SD/text/radixtree

+0

Er, czy znasz jakieś implementacje (lub nawet samouczki!) dla drzewek przyrostka tokenów? –

3

Stworzyłem drzewo przyrostek w Javie która pozwala łatwo dodać własną funkcję wyszukiwania i inne pasujące algorytmy. Mój blog, Suffix Trees in Java, zawiera przegląd oraz instrukcje do pobrania najnowszej wersji. Moja implementacja Java jest oparta na artykule Mark Nelsona o numerze Fast String Searching With Suffix Trees.

Aktualizacja 2016-06-18

+0

Post na blogu ma charakter informacyjny, ale jego źródło jest obecnie niedostępne (Aug'2015), ponieważ wskazuje na https://svn.globalmentor.com/java/trunk/globalmentor-core/, które hasło jest chronione. – codeDr

+0

Robię, co w mojej mocy, aby przekonwertować nasze repozytorium z Subversion na Git i uczynić je ponownie publicznym. To powinno nastąpić w ciągu tygodnia lub dwóch. Możesz do mnie zadzwonić, jeśli do tego czasu nie będzie dostępna. Twoje zdrowie. –

+0

Kod źródłowy jest już dostępny za pośrednictwem Git i Maven Central. Zaktualizowałem powyższą odpowiedź z nową lokalizacją. –