W moich scikits nauczenia Pipeline, chciałbym przekazać niestandardowe słownictwo do CountVectorizer():Scikits nauczenia: Używaj własnego słownictwa wraz z Pipeline
text_classifier = Pipeline([
('count', CountVectorizer(vocabulary=myvocab)),
('tfidf', TfidfTransformer()),
('clf', LinearSVC(C=1000))
])
Jednakże, o ile mi zrozumieć, gdy zgłoszę
text_classifier.fit(X_train, y_train)
Pipeline korzysta z metody fit_transform() CountVectorizera(), która ignoruje myvocab. Jak mogę zmodyfikować mój Pipeline, aby korzystać z myvocab? Dzięki!
Dzięki za poprawkę! – mathias