Mam ramkę danych w pyspark, który ma 15 kolumn.Dynamiczna zmiana nazwy wielu kolumn w PySpark DataFrame
Nazwa kolumny są id
, name
, emp.dno
, emp.sal
, state
, emp.city
, zip
.....
Teraz chcę wymienić nazwy kolumn, które mają '.'
w nich '_'
Ci się 'emp.dno'
do 'emp_dno'
Chciałbym zrobić to dynamicznie
Jak mogę to osiągnąć w pyspark?
@Virureddy, można zakładać moc 'print (df.columns) "jak to jest? – MaxU
@Virureddy, dziękuję! A jak wygląda "print (zamienniki)"? – MaxU
@Virureddy, spróbuj tego: 'df.toDF ([c.replace ('.', '_') Dla c in df.columns])' – MaxU