Kiedy wpadnę John
jako duplikat określenie „nazwa” jako nazwa kolumny:Jak spadać duplikat z DataFrame uwzględnieniem wartości rachunek innej kolumnie
import pandas as pd
data = {'name':['Bill','Steve','John','John','John'], 'age':[21,28,22,30,29]}
df = pd.DataFrame(data)
df = df.drop_duplicates('name')
pandy spada wszystkie podmioty pasujących opuszcza lewą najbardziej:
age name
0 21 Bill
1 28 Steve
2 22 John
Zamiast tego chciałbym zachować wiersz, gdzie wiek Johna jest najwyższy (w tym przykładzie jest to wiek 30. Jak to osiągnąć?
spróbuj tego: 'df.drop_duplicates ('name', 'trzymać' Ostatnia =)' lub 'df.sort_values ('wiek') .drop_duplicates ('name', keep = 'last') ' – MaxU