n-gram

    16Ciepło

    3Odpowiedz

    Używam NLTK do wyszukiwania n-gramów w korpusie, ale w niektórych przypadkach zajmuje to bardzo dużo czasu. Zauważyłem, że obliczanie n-gramów nie jest rzadką cechą w innych pakietach (najwyraźniej Ha

    9Ciepło

    2Odpowiedz

    Jaki jest najlepszy sposób na wyodrębnienie fraz z bloku tekstu? Piszę narzędzie do ekstrakcji słów kluczowych: something like this. Znalazłem kilka bibliotek dla Pythona i Perla, aby wyodrębnić n-gra