W jaki sposób mogę zebrać te dane na konsoli (Spark Shell lub Spark submit job) zaraz po wykonaniu zadania lub zadania.Jak pobierać dane takie jak rozmiar wyjściowy i zapisy napisane w interfejsie użytkownika Spark?
Używamy Sparka do ładowania danych z Mysql do Cassandry i jest dość duży (np .: ~ 200 GB i 600M wierszy). Kiedy zadanie zostanie wykonane, chcemy sprawdzić, ile dokładnie wierszy przebiegło? Możemy uzyskać numer z Spark UI, ale jak możemy pobrać ten numer ("Zapisane dane wyjściowe") z iskrzaka lub z pracy z iskrami.
Przykładowe polecenie do załadowania z MySQL do Cassandry.
val pt = sqlcontext.read.format("jdbc").option("url", "jdbc:mysql://...:3306/...").option("driver", "com.mysql.jdbc.Driver").option("dbtable", "payment_types").option("user", "hadoop").option("password", "...").load()
pt.save("org.apache.spark.sql.cassandra",SaveMode.Overwrite,options = Map("table" -> "payment_types", "keyspace" -> "test"))
Chcę pobrać wszystkie dane Spark UI w powyższym zadaniu głównie Rozmiar wyjściowy i zapisy w formie pisemnej.
Proszę o pomoc.
Dziękujemy za poświęcony czas!