Próbuję zrozumieć, jak partycjonowanie odbywa się w Apache Spark. Czy możecie pomóc, proszę?Jak działa partycjonowanie w Sparku?
Oto scenariusz:
- mistrzem i dwa węzły z 1 rdzenia każdy
- akta
count.txt
z 10 MB
Ile partycji wykonuje następujące utworzyć?
rdd = sc.textFile(count.txt)
Czy rozmiar pliku ma wpływ na liczbę partycji?
Dlaczego opuściłeś odpowiedź bez akceptacji/komentarza? – gsamaras