Wyszkoliłem model klasyfikatora sentencji przy użyciu biblioteki Keras, wykonując poniższe czynności (ogólnie).Keras Text Preprocessing - Zapisywanie obiektu Tokenizer do pliku w celu uzyskania oceny
- Konwersja tekstu corpus w sekwencji z wykorzystaniem Tokenizer obiektu/klasy
- zbudować model stosując metodę model.fit()
- ocenić temu modelowi
Teraz do punktacji przy użyciu tego modelu, I był w stanie zapisać model do pliku i załadować go z pliku. Jednak nie znalazłem sposobu na zapisanie obiektu Tokenizer do pliku. Bez tego będę musiał przetworzyć korpus za każdym razem, gdy muszę zdobyć choć jedno zdanie. Czy istnieje sposób obejścia tego?
Czy wywołasz tokenizer.fit_on_texts ponownie w zestawie testowym ? – cgl
Nie. Jeśli ponownie sprawdzisz dopasowanie *, może zmienić indeks. Tryskacz załadowany piklerem jest gotowy do użycia. –