Chciałbym wykonać operację DISTINCT na podzbiorze kolumn. documentation mówi, że jest to możliwe z zagnieżdżonym foreach:Jak wykonać DISTINCT w Pig Latin w podzbiorze kolumn?
Nie można użyć DISTINCT na podzestawie pól; w tym celu użyj FOREACH i zagnieżdżonego bloku, aby najpierw wybrać pola, a następnie zastosować DISTINCT (patrz Przykład: Zagnieżdżony blok).
To jest proste do wykonania odrębną operację na wszystkich kolumnach:
A = LOAD 'data' AS (a1,a2,a3,a4);
A_unique = DISTINCT A;
Powiedzmy, że jestem zainteresowany wykonaniem odrębny całej A1, A2 i A3. Czy ktoś może podać przykład pokazujący, jak wykonać tę operację z zagnieżdżonym foreach, jak sugeruje dokumentacja?
Oto przykład wejścia i oczekiwany wynik:
A = LOAD 'data' AS(a1,a2,a3,a4);
DUMP A;
(1 2 3 4)
(1 2 3 4)
(1 2 3 5)
(1 2 4 4)
-- insert DISTINCT operation on a1,a2,a3 here:
-- ...
DUMP A_unique;
(1 2 3 4)
(1 2 4 4)
Czy możesz podać przykładowy sygnał wejściowy i oczekiwany wynik? – zero323
Dobra sugestia, zaktualizowałem pytanie. – Freerobots