data.table

    9Ciepło

    6Odpowiedz

    Przykładowe dane: set.seed(1) df <- data.frame(years=sort(rep(2005:2010, 12)), months=1:12, value=c(rnorm(60),NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA)) head(df) years months value

    59Ciepło

    1Odpowiedz

    Myślę, że używam niepoprawnie plyr. Czy ktoś mógłby mi powiedzieć, czy jest to "wydajny" kod plyr? require(plyr) plyr <- function(dd) ddply(dd, .(price), summarise, ss=sum(volume)) Mały kontekst: M

    10Ciepło

    4Odpowiedz

    To pytanie dotyczy ogólnego mechanizmu przekształcania dowolnego zbioru niecyklicznych jednorodnych lub heterogenicznych struktur danych w ramkę danych. Może to być szczególnie przydatne w przypadku p

    17Ciepło

    1Odpowiedz

    Podczas korzystania z pakietu data.table, nie jestem pewien, kiedy muszę setkey(). Na przykład, używając operatora := z opcją by, rzeczy wydają się nadal bardzo szybkie, mimo że nie ustawiłem klucza.

    43Ciepło

    3Odpowiedz

    Jaki jest najlepszy (najszybszy) sposób realizacji funkcji okna przesuwnego z pakietem data.table? Próbuję obliczyć toczącą się medianę, ale mam wiele wierszy na daną datę (z powodu 2 dodatkowych czyn

    88Ciepło

    1Odpowiedz

    Jaki jest najlepszy sposób przypisania do wielu kolumn przy użyciu data.table? Na przykład: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) chciałbym zrobić coś takiego (oczywiście t

    12Ciepło

    2Odpowiedz

    mam następujące próbki data.table: dtb <- data.table(a=sample(1:100,100), b=sample(1:100,100), id=rep(1:10,10)) Chciałbym agregować wszystkie kolumny (A i B, jednak powinny one być przechowywane odd

    26Ciepło

    2Odpowiedz

    Próbuję dodać kolumny do mojego data.table, gdzie nazwy są dynamiczne. Oprócz tego potrzebuję użyć argumentu by podczas dodawania tych kolumn. Na przykład: test_dtb <- data.table(a = sample(1:100, 100

    8Ciepło

    2Odpowiedz

    Mam bardzo dużą ramkę danych w R i chciałbym podsumować dwie kolumny dla każdej odrębnej wartości w innych kolumnach, na przykład, że mieliśmy dane o ramce danych transakcji w różnych sklepach w ciągu

    13Ciepło

    3Odpowiedz

    Chciałbym wydrukować wszystkie kolumny tabeli danych dt z wyjątkiem jednego z nich o nazwie V3, ale nie chcę odnosić się do niego według numeru, ale z nazwy. Jest to kod, który mam: dt = data.table(ma