term-document-matrix

13Ciepło

5Odpowiedz

Używam pakietu tm do uruchomienia analizy tekstu. Mój problem jest z tworzenia listy ze słowami i ich częstotliwości związane z tym samym library(tm) library(RWeka) txt <- read.csv("HW.csv",header=

6Ciepło

1Odpowiedz

Big Text Corpus Breaks tm_map

W ciągu ostatnich kilku dni łamałem sobie głowę nad tym. Przeszukałem wszystkie archiwa SO i próbowałem sugerowanych rozwiązań, ale po prostu nie wydaje się, aby to działało. Mam zestawy dokumentów te

11Ciepło

3Odpowiedz

Efektywna macierz dokumentów terminowych z NLTK

Próbuję stworzyć terminową macierz dokumentów z NLTK i pandami. napisałem następującą funkcję: def fnDTM_Corpus(xCorpus): import pandas as pd '''to create a Term Document Matrix from a NLTK

47Ciepło

4Odpowiedz

Błąd konwersji tekstu na małe litery z tm_map (..., tolower)

Próbowałem używać tm_map. Dało to następujący błąd. Jak mogę to obejść? require(tm) byword<-tm_map(byword, tolower) Error in UseMethod("tm_map", x) : no applicable method for 'tm_map' applied