NLTK Wykorzystanie pos_tag

Staram się używać mowy tagowanie w NLTK i używali tego polecenia:NLTK Wykorzystanie pos_tag

>>> text = nltk.word_tokenize("And now for something completely different") 

>>> nltk.pos_tag(text) 

Traceback (most recent call last): 
File "<pyshell#4>", line 1, in <module> 
nltk.pos_tag(text) 
File "C:\Python27\lib\site-packages\nltk\tag\__init__.py", line 99, in pos_tag 
tagger = load(_POS_TAGGER) 
File "C:\Python27\lib\site-packages\nltk\data.py", line 605, in load 
resource_val = pickle.load(_open(resource_url)) 
File "C:\Python27\lib\site-packages\nltk\data.py", line 686, in _open 
return find(path).open() 
File "C:\Python27\lib\site-packages\nltk\data.py", line 467, in find 
raise LookupError(resource_not_found) 
LookupError: 
********************************************************************** 
Resource 'taggers/maxent_treebank_pos_tagger/english.pickle' not 
found. Please use the NLTK Downloader to obtain the resource:

Jednak pojawia się komunikat o błędzie, który pokazuje:

engish.pickle not found.

mam pobrać całość corpora i plik english.pickle znajduje się w maxtent_treebank_pos_tagger

Co mogę zrobić, aby to działało?

Źródło

2012-12-30 Ashish Singh

Witamy w SO. Staraj się być jak najbardziej opisowy w swoich pytaniach, aby uzyskać najlepsze odpowiedzi. – simonmorley

Twoja instalacja w Pythonie nie może osiągnąć wartości maksymalnej ani treemap. Najpierw sprawdź czy tagger rzeczywiście istnieje:

>>> import nltk

Następnie można sprawdzić za pomocą

>>> dir (nltk)

przejrzeć listę, aby sprawdzić, czy są tam zarówno maxent i treebank.

Łatwiejsze byłoby wpisać

>>> "maxent" in dir(nltk) 
>>> True 
>>> "Treebank in dir(nltk) 
>>> True

Używaj nltk.download() -> zakładka modeli i sprawdzić, czy tagger TreeMap pokazuje jak zainstalować. Powinieneś również spróbować ponownie pobrać tagger.

NLTK Downloader, Models Tab

nadzieję, że pomoże.

Źródło

2012-12-31 20:28:44

thnks @ram mam rozwiązanie mojego problemu. Stworzyłem taggers folderu i skopiowałem maxtent_treebank_pos w to i to w końcu działa .. :) –

Ponad 50 zasobów korpusów i leksykalnych, takich jak WordNet: http://www.nltk.org/nltk_data/ za darmo. Zastosowanie http://nltk.github.com/nltk_data/ jako indeks serwerze zamiast googlecode kodu Google 401: Wymagana autoryzacja

Źródło

2014-10-22 11:39:17

Jeśli nie chcesz korzystać z GUI downloader, można po prostu użyć następujących poleceń w pytona lub ipython powłoki:

import nltk 
nltk.download('punkt') 
nltk.download('maxent_treebank_pos_tagger')

Źródło

2015-07-31 05:18:48 jjinking

Odpowiedz

Powiązane problemy