2016-02-27 1 views
8

Mój cel polega na porównaniu dwóch kolumn i dodaniu kolumny wyników. R używa ifelse, ale muszę znać sposób pandy.Równoważnik R/ifelse w Pythonie/Pandach? Porównaj kolumny ciągów?

R

> head(mau.payment) 
    log_month user_id install_month payment 
1 2013-06  1  2013-04  0 
2 2013-06  2  2013-04  0 
3 2013-06  3  2013-04 14994 

> mau.payment$user.type <-ifelse(mau.payment$install_month == mau.payment$log_month, "install", "existing") 
> head(mau.payment) 
    log_month user_id install_month payment user.type 
1 2013-06  1  2013-04  0 existing 
2 2013-06  2  2013-04  0 existing 
3 2013-06  3  2013-04 14994 existing 
4 2013-06  4  2013-04  0 existing 
5 2013-06  6  2013-04  0 existing 
6 2013-06  7  2013-04  0 existing 

Pandy

>>> maupayment 
user_id log_month install_month 
1  2013-06 2013-04    0 
     2013-07 2013-04    0 
2  2013-06 2013-04    0 
3  2013-06 2013-04   14994 

Próbowałem kilka przypadków, ale nie działa. Wygląda na to, że porównanie ciągów nie działa.

>>>np.where(maupayment['log_month'] == maupayment['install_month'], 'install', 'existing') 

TypeError: 'str' object cannot be interpreted as an integer 

Czy możesz mi pomóc?


Panda i wersja numpy.

>>> pd.version.version 
'0.16.2' 
>>> np.version.full_version 
'1.9.2' 

Po aktualizacji wersji, to działa!

Odpowiedz

8

Musisz zaktualizować pandy do ostatniej wersji, ponieważ w wersji 0.17.1 działa bardzo dobrze.

próbek (pierwsza wartość w kolumnie install_month zmienia się dla dopasowania)

print maupayment 
    log_month user_id install_month payment 
1 2013-06  1  2013-06  0 
2 2013-06  2  2013-04  0 
3 2013-06  3  2013-04 14994 

print np.where(maupayment['log_month'] == maupayment['install_month'], 'install', 'existing') 
['install' 'existing' 'existing']