Używam pakietu tm do uruchomienia analizy tekstu. Mój problem jest z tworzenia listy ze słowami i ich częstotliwości związane z tym samym library(tm)
library(RWeka)
txt <- read.csv("HW.csv",header=
W ciągu ostatnich kilku dni łamałem sobie głowę nad tym. Przeszukałem wszystkie archiwa SO i próbowałem sugerowanych rozwiązań, ale po prostu nie wydaje się, aby to działało. Mam zestawy dokumentów te
Próbuję stworzyć terminową macierz dokumentów z NLTK i pandami. napisałem następującą funkcję: def fnDTM_Corpus(xCorpus):
import pandas as pd
'''to create a Term Document Matrix from a NLTK
Próbowałem używać tm_map. Dało to następujący błąd. Jak mogę to obejść? require(tm)
byword<-tm_map(byword, tolower)
Error in UseMethod("tm_map", x) :
no applicable method for 'tm_map' applied