Chciałbym zmodyfikować wartości komórek kolumny danych (wiek), gdzie obecnie jest ona pusta i zrobiłbym to tylko wtedy, gdyby inna kolumna (zachowana) miała wartość 0 dla odpowiedniego wiersza gdzie jest puste dla Age. Jeśli jest 1 w kolumnie Zachowane, ale puste w kolumnie Wiek, to zachowam ją jako zerową.Pyspark: wiele warunków w przypadku klauzuli
Próbowałem użyć operatora &&
, ale nie zadziałało. Oto mój kod:
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
Jakieś sugestie, jak sobie z tym poradzić? Dzięki.
Komunikat o błędzie:
SyntaxError: invalid syntax
File "<ipython-input-33-3e691784411c>", line 1
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
^