Próbuję losowy model klasyfikacji lasu za pomocą biblioteki H2O
wewnątrz R na zestaw szkoleniowy mający 70 milionów wierszy i 25 funkcji numerycznych. Całkowity rozmiar pliku wynosi 5,6 GB.Dlaczego połączenie kończy się
Rozmiar pliku sprawdzania to 1 GB.
Mam 16 GB pamięci RAM i 8 rdzeni procesorów w moim systemie.
System pomyślnie odczytał oba pliki w obiekcie H2O.
Potem daję poniżej komendy do budowy modelu:
model <- h2o.randomForest(x = c(1:18,20:25), y = 19, training_frame = traindata,
validation_frame = testdata, ntrees = 150, mtries = 6)
Ale po kilku minutach (bez generowania żadnego drzewa), otrzymuję następujący błąd:
"Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion, : Unexpected CURL error: Recv failure: Connection reset by peer"
Jeśli jednak Próbowałem powyżej kodu z 1 drzewem, jego działanie zakończyło się pomyślnie.
Czy powyższy błąd występuje z powodu problemu z pamięcią? Każda pomoc zostanie doceniona.
Mam sprawdzić zużycie pamięci podczas uprawy lasu. Pamięć szybko spada i na końcu dostaję błąd połączenia. zabiję inny proces i uruchomię tylko algo RF. – rks
Daj nam znać, jeśli to pomogło. Alternatywnie możesz spróbować mniej wymagającego zasobu podejścia ML, takiego jak głębokie sieci neuronowe, które istnieją również w podstawowej wersji H2O. – cyberj0g
To był mój błąd. Wcześniej korzystałem z instancji H2O z domyślną opcją pamięci (To było zbyt mało dla moich danych). Teraz uruchamiam instancję H2O z opcją -Xmx14g i algo działa poprawnie. Twoje zdrowie...:). Rozważę twoją sugestię głębokiego uczenia się, jeśli dostanę dokładność mniejszą niż próg w moim przypadku. – rks