Używam NLTK do wyszukiwania n-gramów w korpusie, ale w niektórych przypadkach zajmuje to bardzo dużo czasu. Zauważyłem, że obliczanie n-gramów nie jest rzadką cechą w innych pakietach (najwyraźniej Ha
Jaki jest najlepszy sposób na wyodrębnienie fraz z bloku tekstu? Piszę narzędzie do ekstrakcji słów kluczowych: something like this. Znalazłem kilka bibliotek dla Pythona i Perla, aby wyodrębnić n-gra