Chciałbym generować indeksy do grupowania obserwacji na podstawie dwóch kolumn. Ale chcę, aby grupy były wykonane z obserwacji, które dzielą, przynajmniej jedną obserwację w przestrzeni wspólnej. Widzę, jak tworzyć grupy na podstawie obserwacji, które mają wspólną obserwację, ale nie tylko jedną.Utwórz group_indices na podstawie kilku kolumn
Na przykład, z ramką danych:
dt <- data.frame(id=1:10,
G1 = c("A","A","B","B","C","C","C","D","E","F"),
G2 = c("Z","X","X","Y","W","V","U","s","T","T"))
Chciałbym dostać kolumnie
1,1,1,1,2,2,2,3,4,4
Próbowałem z group_indices z dplyr, ale jeszcze nie udało.
@akrun Dzięki, ale obawia się, że to nie jest dplyr, a wejście zmieni ... – zx8754
Dziękuję, to odpowiedź wydaje się dobre dla mnie wolałbym raczej odpowiedź dplyr, ale i tak jest w porządku. Nie rozumiem, co masz na myśli przez "dane wejściowe ulegną zmianie": czy twoja metoda nie będzie działać z innymi danymi? – Malta
@Malta, ponieważ nie mamy prawdziwych danych, nie mogę powiedzieć, czy twoje dane są podobne do twojego przykładu, wtedy wszystkie powinny działać zgodnie z oczekiwaniami. – zx8754