2014-04-12 29 views
5

wiem, że po treningu modelu lda dla gensim, możemy uzyskać wątek dla niewidocznego dokumentu przez:Gensim uzyskać temat dla dokumentu (dokument widziana)

lda = LdaModel(corpus, num_topics=10) 
doc_lda = lda[doc_bow] 

Ale jak o dokumentach, które już są używane do treningu? Chodzi mi o to, czy istnieje sposób, aby uzyskać temat dokumentu w korpusie, który został użyty w szkoleniu bez traktowania go jak nowego dokumentu?

Odpowiedz

4

Nr

Informacje z poszczególnych dokumentów są destylowane do modelu, a następnie zapominane. Żadna informacja na temat dokumentu nie jest przechowywana (ogólniej: brak informacji, które wymagałyby zachowania pamięci w postaci O(#docs)).

+0

Ale jeśli chcę uzyskać dystrybucję tematów dla wyszkolonego dokumentu, aby móc przeprowadzić operację klastrowania, co mogę zrobić? – storen