W poniższej przykładowej ramce danych chciałbym narysować warstwową próbkę losową (np. 40%) "ID" identyfikatora z każdego poziomu czynnika "Cohort" :R: Uwarunkowana losowa proporcja próbna unikalnych identyfikatorów według zmiennej grupującej
data<-structure(list(Cohort = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), ID = structure(1:20, .Label = c("a1 ",
"a2", "a3", "a4", "a5", "a6", "a7", "a8", "a9", "b10", "b11",
"b12", "b13", "b14", "b15", "b16", "b17", "b18", "b19", "b20"
), class = "factor")), .Names = c("Cohort", "ID"), class = "data.frame", row.names = c(NA,
-20L))
wiem tylko jak wyciągnąć losową liczbę wierszy przy użyciu następujących:
library(dplyr)
data %>%
group_by(Cohort) %>%
sample_n(size = 10)
Ale moje rzeczywiste dane są podłużne, więc mam kilka przypadków tego samego identyfikatora wewnątrz każdej grupie i kilka kohorty o różnych rozmiarach, a więc konieczność wyboru proporcji unikalnych identyfikatorów. Każda pomoc będzie doceniona.
Należy dostarczyć dane, które odtworzenia masz problem, inaczej nie możemy tego zrozumieć ... więc jeśli masz wiele identyfikatorów, proszę produkuj dane za pomocą tej funkcji;) – Arthur