2017-11-29 169 views
5

Mam następujące dane:Jak połączyć wszystkie elementy listy z innej tabeli danych pod warunkiem

library(data.table) 

dt1 <- data.table(var1 = c("wk1","wk1","wk2"), 
        var2 = c(1,2,3)) 

dt2 <- data.table(var3 = c("a","b","c"), 
        var2 = c(1,2,3)) 

lista <- list(dt1,dt2) 

dt_main <- data.table(var1 = c("wk1","wk2"), 
         var4 = c(100,200)) 

Chcę merge wszystkie elementy lista które zawierają zmienną var1 z dt_maindata.table, więc w koniec chciałbym lista wyglądać tak:

dt1 <- data.table(var1 = c("wk1","wk1","wk2"), 
        var2 = c(1,2,3), 
        var4 = c(100,100,200)) 

dt2 <- data.table(var3 = c("a","b","c"), 
        var2 = c(1,2,3)) 

lista <- list(dt1,dt2) 

próbowałem

mapply(function(X,Y){ 
    if("var1"%in%names(X)){ 
    X <- merge(X,Y,by="var1") 
    } 
},X=lista,Y=dt_main) 

ale to nie działa. Jakaś pomoc ?

Odpowiedz

4

Można użyć lapply i scalić wewnątrz funkcji:

lapply(lista, function(x) if (!is.null(x$var1)) { 

    #the function checks if there is a var1 column 
    #and if there is, it gets merged to the x data.table 
    return(merge(dt_main, x, by = 'var1', all.x = TRUE)) 

} else { 

    #otherwise it just returns the data.table 
    return(x) 

}) 

# [[1]] 
# var1 var4 var2 
# 1: wk1 100 1 
# 2: wk1 100 2 
# 3: wk2 200 3 
# 
# [[2]] 
# var3 var2 
# 1: a 1 
# 2: b 2 
# 3: c 3 
+3

trochę za późno, b ut Wyszedłem z nieco inną odmianą: 'lapply (lista, function (x) if ('var'% w% nazwach (x)) x [dt_main, on = 'var1', var4: = var4] else x) ' – Jaap

+0

Kolejny fajny sposób na połączenie :). Chcesz opublikować jako odpowiedź @Jap? – LyzandeR

+2

done :-) (i poprawiono typ w moim rozwiązaniu) – Jaap

4

nieco inny sposób to zrobić:

lapply(lista, function(x) if ('var1' %in% names(x)) 
    x[dt_main, on = 'var1', var4 := var4][] 
    else x 
) 

co daje:

[[1]] 
    var1 var2 var4 
1: wk1 1 100 
2: wk1 2 100 
3: wk2 3 200 

[[2]] 
    var3 var2 
1: a 1 
2: b 2 
3: c 3