mam df tak:Python Pandy: grupa według grupy i średnia?
cluster org time
1 a 8
1 a 6
2 h 34
1 c 23
2 d 74
3 w 6
chciałbym obliczyć średnią czasu za org za klastra.
Oczekiwany wynik:
cluster mean(time)
1 15 ((8+6/2)+23)/2
2 54 (74+34)/2
3 6
Nie wiem, jak to zrobić w Pandy, może ktoś pomóc?
Niestety ty chcąc 'df.groupby ([ 'org', 'klaster']) oznaczają()'? nie jest to znaczące dla twojego zestawu danych, w przeciwieństwie do tego: 'df.groupby (['cluster', 'org']). mean()' – EdChum
@EdChum dzięki za twoją pomoc, ale ja nie chcę żadnego z nich. Ale "średnia średnich czasów na org". Proszę zobaczyć oczekiwany wynik (edytowany) – UserYmY