Mam duży pyspark.sql.dataframe.DataFrame
i chcę zachować (tak filter
) wszystkie wiersze, w których adres URL zapisany w kolumnie location
zawiera wstępnie określony ciąg znaków, np. "google.com".Filtruj df, gdy wartości pasują do fragmentu ciągu znaków w pyspark
Próbowałem df.filter(sf.col('location').contains('google.com')
ale to rzuca
TypeError: _TypeError: 'Column' object is not callable'
Jak mogę obejść i filtrować moje df prawidłowo? Z góry bardzo dziękuję!
Spróbuj 'df.filter ("położenie jak '% google.com%'") ' – mrsrinivas