mam dane, które już pogrupowane i sumarycznych, wygląda tak:Pig: Get najwyższej wartości n na grupę
user value count
---- -------- ------
Alice third 5
Alice first 11
Alice second 10
Alice fourth 2
...
Bob second 20
Bob third 18
Bob first 21
Bob fourth 8
...
Dla każdego użytkownika (Alicja i Bob), chcę odzyskać swoją top n wartości (powiedzmy 2), posortowane terminy "count". więc sygnał wyjściowy Chcę to:
Alice first 11
Alice second 10
Bob first 21
Bob second 20
Jak można tego dokonać?
świetnie, dzięki! Limit – Hoff
nie gwarantuje, że otrzymasz najlepsze rekordy. –
[docs] (https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#LIMIT) mówią, że wykonanie 'limitu' po' zamówieniu 'kolekcji gwarantuje, że otrzymasz top records –