Tak więc zastanawiałem się, czy ktoś nie ma pojęcia, jak połączyć wiele terminów, aby utworzyć pojedynczy termin w taggerach w NLTK..Jak dodać wyrazy złożone do taggera w NLTK?
Na przykład, kiedy zrobić:
nltk.pos_tag(nltk.word_tokenize('Apple Incorporated is the largest company'))
Daje mi:
[('Apple', 'NNP'), ('Incorporated', 'NNP'), ('is', 'VBZ'), ('the', 'DT'), ('largest', 'JJS'), ('company', 'NN')]
Jak zrobić to umieścić 'jabłko' i 'Włączone' Wspólnie się ('Apple Incorporated','NNP')
potrzebujesz kawałka/parsera, a następnie połączyć kawałki/frazy za pomocą '_', a następnie spłaszcz strukturę ponownie w krotkach. – alvas