Jeśli mam ciąg tekstowy do wektoryzacji, jak mam obsługiwać liczby wewnątrz niego? Albo jeśli zasilę sieć neuronową liczbami i słowami, w jaki sposób mogę zachować liczby jako liczby?Jak traktować liczby w ciągach tekstowych podczas wektoryzacji słów?
Mam zamiar zrobić słownik wszystkich moich słów (as suggested here). W takim przypadku wszystkie łańcuchy staną się tablicami liczb. Jak mam obsługiwać znaki, które są liczbami? jak wyprowadzić wektor, który nie miesza indeksu słów ze znakiem liczby?
Czy konwertowanie liczb na ciągi osłabia informacje, które przekazuję sieci?
W wielu aplikacjach słowa, które nie istnieją w słowniku, są konwertowane na ''. W ten sam sposób, w zależności od aplikacji, wygodne może być przekonwertowanie wszystkich liczb na specjalny token, na przykład ''. –