Mamy klasyfikator do stron internetowych. Model klasyfikatora został zbudowany z danymi pociągu sprzed około dwóch lat. Zauważyliśmy, że wydajność modelu wciąż się pogarsza i zakładamy, że jego właściwości zmieniają się w czasie (najczęściej używane słowa i terminologia, ale także topologia, tagi html itp.).Orzeźwiające dane treningowe dla nadzorowanego uczenia się - jak?
Jak podszedłbyś do tego problemu? czy po prostu ponownie zbudujemy wszystkie dane pociągu i ponownie nauczymy się nowego modelu? Czy jest skrót? Czy są jakieś popularne praktyki lub dokumenty dotyczące tego, jak to zrobić? Zauważ, że jesteśmy dość uzależnieni od podejścia nadzorowanego uczenia się, w którym administratorzy systemu szkolą klasyfikator, oceniają jego wydajność na zestawie testowym, a następnie instalują klasyfikator w systemie "produkcyjnym".
Nadzieja ta nie jest zbyt niejasne ...
Jeśli model nie jest już dobry, proponuję zbudować nowy. Jaki algorytm został użyty do zbudowania modelu? – AdrienNK
hi @ihadanny, czy rozwiązałeś swój problem? – tktktk0711