mam ten kod:Take n wierszy z dataframe zapłonowej i przekazywanie toPandas()
l = [('Alice', 1),('Jim',2),('Sandra',3)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df.withColumn('age2', df.age + 2).toPandas()
działa dobrze, robi to, co musi. Załóżmy jednak, że chcę wyświetlić tylko pierwsze n wierszy, a następnie wywołać toPandas()
, aby zwrócić ramkę danych pandy. Jak mam to zrobić? Nie mogę zadzwonić pod numer take(n)
, ponieważ to nie zwraca ramki danych, a tym samym nie mogę jej przesłać do toPandas()
.
Podążając w inny sposób, w jaki sposób mogę pobrać górne n wierszy z ramki danych i wywołać toPandas()
na wynikowej ramce danych? Nie mogę myśleć, że to jest trudne, ale nie mogę tego rozgryźć.
Używam Spark 1.6.0.
Zobacz Wiedziałem, że to będzie łatwe :) Dziękuję bardzo. – jamiet
Nie ma za co! – Neo