Używam funkcji rangowania Pig 0.11.0 i generowania rang dla każdego id w moich danych. Potrzebuję rankingu moich danych w określony sposób. Chcę, aby ranga została zresetowana i zaczynała się od 1 dla każdego nowego identyfikatora.Użycie funkcji rankingu Apache Pig
Czy można użyć funkcji rang bezpośrednio dla tego samego? Wszelkie wskazówki byłyby mile widziane.
danych:
id,rating
X001, 9
X001, 9
X001, 8
X002, 9
X002, 7
X002, 6
X002, 5
X003, 8
X004, 8
X004, 7
X004, 7
X004, 4
Z użyciem funkcji rangi takie jak: op = dane rangi o identyfikatorze wynik;
uzyskać to wyjście
rank,id,rating
1, X001, 9
1, X001, 9
2, X001, 8
3, X002, 9
4, X002, 7
5, X002, 6
6, X002, 5
7, X003, 8
8, X004, 8
9, X004, 7
9, X004, 7
10, X004, 4
Pożądany O/P:
rank,id,rating
1, X001, 9
1, X001, 9
2, X001, 8
1, X002, 9
2, X002, 7
3, X002, 6
4, X002, 5
1, X003, 8
1, X004, 8
2, X004, 7
2, X004, 7
3, X004, 4