2015-12-16 12 views
6

Mam DataFrame, który wygląda tak:Pandy GroupBy z kosza liczy

+----------+---------+-------+ 
| username | post_id | views | 
+----------+---------+-------+ 
| john  |  1 |  3 | 
| john  |  2 | 23 | 
| john  |  3 | 44 | 
| john  |  4 | 82 | 
| jane  |  7 |  5 | 
| jane  |  8 | 25 | 
| jane  |  9 | 46 | 
| jane  |  10 | 56 | 
+----------+---------+-------+ 

i chciałbym, aby przekształcić go liczyć poglądy, które należą do niektórych pojemników tak:

+------+------+-------+-------+--------+ 
|  | 1-10 | 11-25 | 25-50 | 51-100 | 
+------+------+-------+-------+--------+ 
| john | 1 |  1 |  1 |  1 | 
| jane | 1 |  1 |  1 |  1 | 
+------+------+-------+-------+--------+ 

I próbowałem:

bins = [1, 10, 25, 50, 100] 
groups = df.groupby(pd.cut(df.views, bins)) 
groups.username.count() 

Ale to daje tylko liczbę agregatów i nie liczy się przez użytkownika. Jak mogę uzyskać liczbę binów według użytkownika?

liczy łącznie (z wykorzystaniem moje prawdziwe dane) wygląda następująco:

impressions 
(2500, 5000]   2332 
(5000, 10000]  1118 
(10000, 50000]  570 
(50000, 10000000]  14 
Name: username, dtype: int64 

Odpowiedz

7

Mogłeś grupa obu pojemników i nazwę użytkownika, obliczenia wielkości grupy, a następnie użyć unstack():

>>> groups = df.groupby(['username', pd.cut(df.views, bins)]) 
>>> groups.size().unstack() 
views  (1, 10] (10, 25] (25, 50] (50, 100] 
username 
jane   1   1   1   1 
john   1   1   1   1