Mój zbiór danych zawiera wiele obserwacji dla różnych gatunków. Każdy gatunek ma inną liczbę obserwacji. Poszukuje szybkiego sposobu w R, aby obliczyć średnią z 10% górnych wartości dla danej zmiennej dla każdego gatunku.Jak obliczyć średnią z 10% najlepszych w R
Wymyśliłem, jak uzyskać określoną liczbę wartości (tj. Górne 20 wartości).
clim6 <-setDT(range)[order(species, clim6),.SD[1:20],by=species]
write.csv(Bioclimlo6, file = "clim6.csv")
wiem też, że istnieje sposób, aby przyciąć zestawu danych w celu wygenerowania średnią pozostałego zbioru danych, ale nie jestem pewien, jak przycinać tylko dolne 90%.
mean(x, trim = 0, na.rm = FALSE)
'średnia (X [x> = kwantylu (x, 0,9 na.rm = PRAWDA)], na. rm = TRUE) ' – eipi10
Dlaczego wolisz średnią niż obliczenie 95. percentyla danych? – cxrodgers