Próbowałem zrozumieć program MapReduce. Robiąc to zauważyłem, że zadania redukujące rozpoczynają się niemal natychmiast po wykonaniu wszystkich map. Teraz jest to zaskakujące, ponieważ zadania redukujące działają z danymi zgrupowanymi według klucza, co oznacza, że pomiędzy nimi jest wykonywany krok losowy/sort. Jedynym sposobem, aby to się stało, jest to, że tasowanie odbywa się równolegle z mapowaniem.Czy krok shuffle w programie MapReduce działa równolegle z mapowaniem?
Po drugie, jeśli tasowanie rzeczywiście odbywa się równolegle z mapowaniem, co jest odpowiednikiem tego w Apache Spark? Czy mapowanie i grupowanie za pomocą kluczy i/lub sortowania może również odbywać się równolegle?
bardzo krótkich odpowiedzi (zbyt krótki dla normalnego odpowiedź): widać przetasowań jak nowe etapach Spark's DAG. Nowy etap = nowy przetasowanie, prawdopodobnie z kilkoma wyjątkami –
dla mapyZastosuj część pytania, ten post może być pomocny: http://stackoverflow.com/questions/22141631/what-is-the- purpose-of- shuffling- i-sortowanie-faza-w-reduktor-w-mapie-redukują/22169760 # 22169760 – vefthym