Oto krótka data.table:Sortowanie danych z tabeli aby specyficzne wartości
DT <- data.table(Tag1 = c(22,253,6219,6219,252862,252864,312786,312812),
Tag2 = c(22,255,6220,252857,252863,252865,251191,252863),
Date= as.Date(as.character(c("7/25/2008","6/15/2000","6/30/2000","9/6/2002","9/6/2002","9/6/2002","9/3/2003","9/5/2003")),format = "%m/%d/%Y"))
DT
Tag1 Tag2 Date
1: 22 22 2008-07-25
2: 253 255 2000-06-15
3: 6219 6220 2000-06-30
4: 6219 252857 2002-09-06
5: 252862 252863 2002-09-06
6: 252864 252865 2002-09-06
7: 312786 251191 2003-09-03
8: 312812 252863 2003-09-05
Chciałbym sortować data.table w kolejności rosnącej przez 3 kolumny: tag1, tag2 i datą. I badane:
> test <- DT[order(Tag1, Tag2, Date)]
> test
Tag1 Tag2 Date
1: 22 22 2008-07-25
2: 253 255 2000-06-15
3: 6219 6220 2000-06-30
4: 6219 252857 2002-09-06
5: 252862 252863 2002-09-06
6: 252864 252865 2002-09-06
7: 312786 251191 2003-09-03
8: 312812 252863 2003-09-05
Jednakże chciałbym posortować data.table następująco:
> test
Tag1 Tag2 Date
1: 22 22 2008-07-25
2: 253 255 2000-06-15
3: 6219 6220 2000-06-30
4: 6219 252857 2002-09-06
5: 252862 252863 2002-09-06
6: 312812 252863 2003-09-05
7: 252864 252865 2002-09-06
8: 312786 251191 2003-09-03
W szczególności zduplikowane wartości Tag1 lub Tag1 powinny być umieszczone jeden pod drugim (na przykład: 6219 dla Tag1 i 252863 dla Tag2). Jak mogę to zrobić?
EDIT:
Proponowane rozwiązania działać przez krótki data.table (jak wyżej data.table). Tutaj jest już wersja:
DT <- data.table(Tag1 = c(252860, 252862, 312812, 252864, 252866, 252868, 252870, 318880, 252872, 252874, 252876, 252878, 252880, 252880, 252881, 252883,
252885, 252887, 311264, 252889, 252889, 252892, 318879, 318880, 318881), Tag2 = c(252861, 252863, 252863, 252865, 252867, 252869, 252871, 252871, 252873,
252875, 252877, 252879, 414611, 905593, 252882, 252884, 252886, 252888, 252888, 252890, 318904, 252893, 318878, 414547, 318882), Date = c("9/6/2002",
"9/6/2002", "9/5/2003", "9/6/2002", "9/6/2002", "9/6/2002", "9/6/2002", "10/8/2003", "9/6/2002", "9/6/2002", "9/6/2002", "9/6/2002", "10/5/2004",
"9/6/2002", "9/6/2002", "9/6/2002", "9/10/2002", "9/10/2002", "7/15/2003", "9/10/2002", "10/15/2003", "9/10/2002", "10/8/2003", "9/29/2004","10/8/2003"))
Oto oczekiwany wynik (tj data.table „po”). W szczególności data.table „po” powinny być zgodne z dwóch warunków:
1) rzędy są klasyfikowane przez pory w porządku rosnącym
2) zduplikowane wartości Tag1 lub Tag1 są umieszczone jeden pod drugi (ostatecznie nie jest potrzebny w porządku rosnącym)
Wszystkie zduplikowane wartości dla Tag1 i Tag2 są żółte.
Wtedy może trzeba przełamać 'order'. tj. "DT [, lapply (DT, sort)]' – akrun
@Sathish To był komentarz, a nie odpowiedź. Z tego powodu nie opublikowałem tego. – akrun
Jakiego rodzaju danych używasz do tego rodzaju grupowania/zamawiania? – HubertL