n-gram

16Ciepło

3Odpowiedz

Używam NLTK do wyszukiwania n-gramów w korpusie, ale w niektórych przypadkach zajmuje to bardzo dużo czasu. Zauważyłem, że obliczanie n-gramów nie jest rzadką cechą w innych pakietach (najwyraźniej Ha

9Ciepło

2Odpowiedz

Wyodrębnij frazy z tekstu (1-4 słowo ngrams)

Jaki jest najlepszy sposób na wyodrębnienie fraz z bloku tekstu? Piszę narzędzie do ekstrakcji słów kluczowych: something like this. Znalazłem kilka bibliotek dla Pythona i Perla, aby wyodrębnić n-gra