Pandy: Czy istnieje sposób, aby użyć czegoś takiego jak "droplevel", a następnie zmienić nazwę drugiego poziomu, używając upuszczonych etykiet poziomu jako przedrostka/sufiksu?

Zrzut ekranu z poniższej zapytania:Pandy: Czy istnieje sposób, aby użyć czegoś takiego jak "droplevel", a następnie zmienić nazwę drugiego poziomu, używając upuszczonych etykiet poziomu jako przedrostka/sufiksu?

Czy istnieje sposób, aby łatwo spaść górny indeks kolumny poziom i mają jeden poziom z wytwórni takich jak points_prev_amax, points_prev_amin, gf_prev_amax, gf_prev_amin i tak dalej?

Źródło

2016-09-09 hkhare

Zastosowanie list comprehension dla określonych nowych nazw kolumn:

df.columns = df.columns.map('_'.join) 

Or: 

df.columns = ['_'.join(col) for col in df.columns]

Próbka:

df = pd.DataFrame({'A':[1,2,2,1], 
        'B':[4,5,6,4], 
        'C':[7,8,9,1], 
        'D':[1,3,5,9]}) 

print (df) 
    A B C D 
0 1 4 7 1 
1 2 5 8 3 
2 2 6 9 5 
3 1 4 1 9 

df = df.groupby('A').agg([max, min]) 

df.columns = df.columns.map('_'.join) 
print (df) 
    B_max B_min C_max C_min D_max D_min 
A           
1  4  4  7  1  9  1 
2  6  5  9  8  5  3

print (['_'.join(col) for col in df.columns]) 
['B_max', 'B_min', 'C_max', 'C_min', 'D_max', 'D_min'] 

df.columns = ['_'.join(col) for col in df.columns] 
print (df) 
    B_max B_min C_max C_min D_max D_min 
A           
1  4  4  7  1  9  1 
2  6  5  9  8  5  3

Jeśli potrzebujesz prefix proste elementy wymienne krotek:

df.columns = ['_'.join((col[1], col[0])) for col in df.columns] 
print (df) 
    max_B min_B max_C min_C max_D min_D 
A           
1  4  4  7  1  9  1 
2  6  5  9  8  5  3

Innym rozwiązaniem:

df.columns = ['{}_{}'.format(i[1], i[0]) for i in df.columns] 
print (df) 
    max_B min_B max_C min_C max_D min_D 
A           
1  4  4  7  1  9  1 
2  6  5  9  8  5  3

Jeśli len kolumn jest duża (10^6), wówczas raczej używać to_series i str.join:

df.columns = df.columns.to_series().str.join('_')

Źródło

2016-09-09 07:23:00 jezrael

Korzystanie konfiguracja @ jezrael za

df = pd.DataFrame({'A':[1,2,2,1], 
        'B':[4,5,6,4], 
        'C':[7,8,9,1], 
        'D':[1,3,5,9]}) 

df = df.groupby('A').agg([max, min])

Przypisywanie nowe kolumny z

from itertools import starmap 

def flat(midx, sep=''): 
    fstr = sep.join(['{}'] * midx.nlevels) 
    return pd.Index(starmap(fstr.format, midx)) 

df.columns = flat(df.columns, '_') 

df

Źródło

2016-09-09 08:38:13 piRSquared

@jezrael Jest to nowy wpadłem dzisiaj ;-) zrozumieniem wciąż nieco szybciej. – piRSquared

Myślę, że jest jeden wyjątek - jeśli len kolumn jest bardzo duży (kilka 10^6), to jest to szybsze. 'df.columns = df.columns.to_series(). str.join ('_')'. Ale myślę, że praktycznie len z "kolumn" jest mały, więc zrozumienie listy jest lepsze. – jezrael

@jezrael jest również szybszy, gdy jest więcej poziomów. 'pd.MultiIndex.from_product ([lista ('ABCD'), zakres (4), lista ('wxyz')])' – piRSquared

Pandy: Czy istnieje sposób, aby użyć czegoś takiego jak "droplevel", a następnie zmienić nazwę drugiego poziomu, używając upuszczonych etykiet poziomu jako przedrostka/sufiksu?

Odpowiedz

Powiązane problemy