mam X jako csr_matrix że uzyskano stosując scikit za tfidf Vectorizer i Y, który jest tablicąJak zainicjalizować zmienną gensim corpus za pomocą csr_matrix?
Mój plan jest stworzenie możliwości z wykorzystaniem LDA, jednak nie udało mi się znaleźć sposób, aby zainicjować zmienną corpus danej gensim na literę X jako csr_matrix. Innymi słowy, nie chcę pobierać korpusu, jak pokazano w dokumentacji gensim, ani konwertować X na gęstą matrycę, ponieważ pochłaniałoby to dużo pamięci i komputer mógł się zawiesić.
Krótko mówiąc, moje pytania są następujące,
- Jak zainicjować corpus gensim zważywszy, że mam csr_matrix (rzadki) reprezentujący cały korpus?
- Jak korzystać z LDA do wyodrębniania funkcji?
Czy możemy również przekazać macierz częstotliwości do tej metody również? – Shashank