Wyobraź sobie, że mam DataFrame
z kolumnami zawierającymi tylko rzeczywiste wartości.Grupuj podane percentyle wartości wybranej kolumny DataFrame
>> df
col1 col2 col3
0 0.907609 82 4.207991
1 3.743659 1523 6.488842
2 2.358696 324 5.092592
3 0.006793 0 0.000000
4 19.319746 11969 7.405685
I pogrupować jej przez kwartyli (lub innych percentyli określonych Me) wybranego kolumnie (np col1
) do wykonywania pewnych operacji na tych grupach. Idealnie, chciałbym zrobić coś takiego:
df.groupy(quartiles_of_col1).mean() # not working, how to code quartiles_of_col1?
Wyjście powinno dać średnią z każdej z kolumn dla czterech grup odpowiadających kwartyla col1
. Czy jest to możliwe przy użyciu polecenia groupby
? Jaki jest najprostszy sposób na osiągnięcie tego?
To działa dla mnie! Doskonałe wykorzystanie cięcia! Podzięka za championa – biobirdman
Przykład dodany. Okazuje się, że chcesz ustawić 'include_lowest' na 'True', w przeciwnym razie najmniejsze numery zostaną pominięte. Edytowane. Twoje zdrowie! –