9
Wymyśliłem te dwie metody. Czy jest lepszy?Jaki jest najlepszy sposób na zsumowanie wszystkich wartości w ramce danych Pandy?
>>> import pandas as pd
>>> df = pd.DataFrame({'A': [5, 6, 7], 'B': [7, 8, 9]})
>>> print df.sum().sum()
42
>>> print df.values.sum()
42
Chcę się tylko upewnić, że nie brakuje mi czegoś bardziej oczywistego.
Dzięki. Tak myślałem! – Bill
Czy jest to szybsze tylko dlatego, że jedna funkcja wywołuje drugą, czy też jest jakaś zasadnicza różnica? – kuanb
@kuanb dwa powody. Po pierwsze, 'df.values.sum()' jest operacją 'numpy' i przez większość czasu' numpy' jest bardziej wydajne. Dwa, 'numpy' sumuje wszystkie elementy w tablicy niezależnie od wymiarów. 'panda' wymaga dwóch oddzielnych wywołań do' sum' jednego dla każdego wymiaru. – piRSquared