2015-03-15 7 views
6

Kiedy zrobić data[genres].sum() uzyskać następujący wyniknumpy rodzaj działając dziwnie przy sortowaniu na DataFrame pandy

Action  1891 
Adult   9 
Adventure  1313 
Animation  314 
Biography  394 
Comedy  3922 
Crime   1867 
Drama   5697 
Family   754 
Fantasy  916 
Film-Noir  40 
History  358 
Horror  1215 
Music   371 
Musical  260 
Mystery  1009 
News    1 
Reality-TV  1 
Romance  2441 
Sci-Fi   897 
Sport   288 
Thriller  2832 
War   512 
Western  235 
dtype: int64 

Ale kiedy próbuję uporządkować od sumy z wykorzystaniem np.sort

genre_count = np.sort(data[genres].sum())[::-1] 
pd.DataFrame({'Genre Count': genre_count})` 

otrzymuję następujący wynik:

`Out[19]: 
    Genre Count 
0 5697 
1 3922 
2 2832 
3 2441 
4 1891 
5 1867 
6 1313 
7 1215 
8 1009 
9 916 
10 897 
11 754 
12 512 
13 394 
14 371 
15 358 
16 314 
17 288 
18 260 
19 235 
20 40 
21 9 
22 1 
23 1 

Spodziewany wynik powinien wyglądać następująco:

Genre Count 
Drama 5697 
Comedy 3922 
Thriller 2832 
Romance  2441 
Action 1891 
Crime 1867 
Adventure 1313 
Horror 1215 
Mystery  1009 
Fantasy  916 
Sci-Fi 897 
Family 754 
War  512 
Biography 394 
Music 371 
History  358 
Animation 314 
Sport 288 
Musical  260 
Western  235 
Film-Noir 40 
Adult 9 
News 1 
Reality-TV 1 

Wygląda na to, że numpy ignoruje kolumnę gatunku.

Czy ktoś może mi pomóc zrozumieć, gdzie się źle dzieje?

Odpowiedz

5

data[genres].sum() zwraca serię. Kolumna gatunku nie jest w rzeczywistości kolumną - jest to indeks.

np.sort tylko patrzy na wartościach DataFrame lub serii, nie w indeksie, i zwraca nową tablicę NumPy z posortowanych data[genres].sum() wartości. Informacje indeksu zostaną utracone.

Sposób sortowania data[genres].sum() i przechowywać informacje indeksu byłoby zrobić coś takiego:

genre_count = data[genres].sum() 
genre_count.sort(ascending=False) # in-place sort of genre_count, high to low 

Następnie można włączyć sortowanie Series genre_count powrotem do DataFrame jeśli chcesz:

pd.DataFrame({'Genre Count': genre_count}) 
+0

To zadziałało pięknie .... Wielkie dzięki za pomoc! :) – function

+0

Bez problemu - cieszę się, że pomogło! –