Właśnie okazało się, że przy użyciu Amazon Elastic Map Reduce, mogę podać krok, aby mieć jedną z trzech opcji ActionOnFailure:Elastyczna mapa Zmniejsz: różnica między CANCEL_AND_WAIT i CONTINUE?
- TERMINATE_JOB_FLOW
- CANCEL_AND_WAIT
- CONTINUE
TERMINATE_JOB_FLOW jest domyślnym i oczywiste - wyłącza cały klaster po niepowodzeniu w kroku.
Jaka jest różnica między CANCEL_AND_WAIT i CONTINUE? Wydaje mi się, że oba będą utrzymywać klaster uruchomiony i po prostu przejdą do następnego kroku, kiedy zostanie dodany.
Dzięki! To całkowicie ma sens - jest to dla mnie takie samo, ponieważ w boto dodam tylko nowe kroki po zakończeniu poprzedniego, więc CANCEL_AND_WAIT i CONTINUE są takie same z mojej perspektywy. – Suman
* Myślę, że * nawet przy opcji --stay-alive, TERMINATE_JOB_FLOW jest opcją domyślną. Uruchomiłem kilka klastrów z podtrzymaniem, które kończą się, gdy jeden z kroków się nie powiedzie. – Suman
Nie dzieje się tak dla mnie, wszystkie dodane kroki przechodzą w stan "ANULOWANE", a klaster znajduje się w polu "Oczekiwanie". Być może czegoś tu brakuje. – Amar