Mam pandę DataFrame
o nazwie data
z kolumną o nazwie ms
. Chcę wyeliminować wszystkie wiersze, w których data.ms
jest powyżej percentyla 95%. Na razie robię to:Eliminowanie wszystkich danych z danego percentyla
limit = data.ms.describe(90)['95%']
valid_data = data[data['ms'] < limit]
który działa, ale chcę uogólnić to do dowolnego percentyla. Jaki jest najlepszy sposób na zrobienie tego?
użyciu pandy, jeśli chcę porównać różne kol ze szczególnym kwantyl, istnieje szybka metoda podobna nadawanie numpy? –
działa również przy usuwaniu wszystkich kolumn, tj. 'Df [df