Uruchomienie modelu po wyjęciu z pudełka generuje te pliki w katalogu danych:Szkolenie niestandardowy zestaw danych z przetłumaczyć modelu
ls
dev-v2.tgz newstest2013.en
giga-fren.release2.fixed.en newstest2013.en.ids40000
giga-fren.release2.fixed.en.gz newstest2013.fr
giga-fren.release2.fixed.en.ids40000 newstest2013.fr.ids40000
giga-fren.release2.fixed.fr training-giga-fren.tar
giga-fren.release2.fixed.fr.gz vocab40000.from
giga-fren.release2.fixed.fr.ids40000 vocab40000.to
Czytając src translate.py:
https://github.com/tensorflow/models/blob/master/tutorials/rnn/translate/translate.py
tf.app.flags.DEFINE_string("from_train_data", None, "Training data.")
tf.app.flags.DEFINE_string("to_train_data", None, "Training data.")
Aby wykorzystać własne dane treningowe, utworzyłem dane z moich danych z pociągu i dodałem własne dane treningowe do każdego z tych katalogów, trainin g dane są zawarte w plikach mydata.from & mydata.to
my-to-train-data contains mydata.from
my-from-train-data contains mydata.to
nie mogę znaleźć dokumentację, aby przy użyciu własnych danych szkoleniowych lub w jakim formacie powinien upłynąć więc wywnioskować to z src translate.py i treści katalogu danych utworzonego podczas wykonywania modelu tłumaczenia z pudełka.
Zawartość mydata.from:
Is this a question
zawartość mydata.to:
Yes!
ja spróbuje trenować model używając:
python translate.py --from_train_data my-from-train-data --to_train_data my-to-train-data
Powrócisz ze związkiem błąd:
tensorflow.python.framework.errors_impl.NotFoundError: my-from-train-data.ids40000
Pojawia się Potrzebuję utworzyć plik my-from-train-data.ids40000, jaka powinna być jego zawartość? Czy istnieje przykład szkolenia tego modelu przy użyciu niestandardowych danych?
Czy otrzymujesz dane wyjściowe ze skryptu (inne niż błąd)? –
@ MaximilianKöstler nie, tylko błąd. Czy wyszkoliłeś ten model za pomocą niestandardowego zestawu danych? –