2013-05-27 30 views
7

mam następujące dataframe (DF1)R- rzędy zwijania i suma wartości w kolumnie

ID someText PSM OtherValues 
ABC c 2 qwe 
CCC v 3 wer 
DDD b 56 ert 
EEE m 78 yu 
FFF sw 1 io 
GGG e 90 gv 
CCC r 34 scf 
CCC t 21 fvb 
KOO y 45 hffd 
EEE u 2 asd 
LLL i 4 dlm 
ZZZ i 8 zzas 

Chciałbym zwinąć w pierwszej kolumnie i dodać odpowiednie wartości i PSM Chciałbym uzyskać następujące wyjście:

ID Sum PSM 
ABC 2 
CCC 58 
DDD 56 
EEE 80 
FFF 1 
GGG 90 
KOO 45 
LLL 4 
ZZZ 8 

Wydaje się być wykonalne z funkcją agregującą, ale nie zna składni. Każda pomoc jest naprawdę doceniana! Dzięki.

Odpowiedz

16

W bazie:

aggregate(PSM ~ ID, data=x, FUN=sum) 
## ID PSM 
## 1 ABC 2 
## 2 CCC 58 
## 3 DDD 56 
## 4 EEE 80 
## 5 FFF 1 
## 6 GGG 90 
## 7 KOO 45 
## 8 LLL 4 
## 9 ZZZ 8 
2

To jest bardzo proste przy użyciu pakietu plyr:

library(plyr) 
ddply(df1, .(ID), summarize, Sum=sum(PSM)) 
1

Przykład wykorzystania dplyr, następnej iteracji plyr:

df2 <- df1 %>% group_by(ID) %>% 
    summarize(Sum_PSM = sum(PSM)) 

Kiedy można umieścić znaki %>%, jesteś "rurociągiem". Oznacza to, że wprowadzasz to, co znajduje się po lewej stronie tego operatora i wykonujesz funkcję po prawej stronie.