I chcę, aby dowiedzieć się, co wszystkie pozycje df, które nie są w DF1, także pozycje DF1 ale nie w dfPyspark „PipelinedRDD” ma atrybut „Show”
df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
df2 = df.subtract(df1)
df2.show()
df3 = df1.subtract(df)
df3.show()
Wystarczy chcieć aby sprawdzić wynik, aby zobaczyć, czy dobrze rozumiem funkcję. Ale dostałem ten błąd Obiekt "PipelinedRDD" nie ma atrybutu "pokaż" jakiejkolwiek sugestii?
to nie działa, ponieważ DF3 jest RDD, a nie dataframe. – David