Jaki jest najlepszy sposób uwzględnienia (nie liczby) wartości nan w pandach DataFrame?Jak zliczać nan w pandach DataFrame?
Następujący kod:
import numpy as np
import pandas as pd
dfd = pd.DataFrame([1, np.nan, 3, 3, 3, np.nan], columns=['a'])
dfv = dfd.a.value_counts().sort_index()
print("nan: %d" % dfv[np.nan].sum())
print("1: %d" % dfv[1].sum())
print("3: %d" % dfv[3].sum())
print("total: %d" % dfv[:].sum())
Wyjścia:
nan: 0
1: 1
3: 3
total: 4
Gdy żądana jest:
nan: 2
1: 1
3: 3
total: 6
ja pomocą pandy 0,17 Pythona 3.5.0 do 2.4 Anacondą .0.
i po użyciu powyższej metody dfv.values.sum() zlicza wszystkie wartości, tj Dzięki. ;) – SpeedCoder5
Nie ma problemu! Tak, to działa. W rzeczywistości wystarczy napisać 'dfv.sum()', aby zliczyć wszystkie wartości. Lub jeszcze bardziej wydajnie, po prostu sprawdź 'len (dfd)'. –