Patrzę na funkcję przesuwania okna dla Spark DataFrame w Spark SQL, Scala.islowe okno funkcji sql opóźnienie
Mam ramkę danych z kolumnami Col1, Col1, Col1, data.
Col1 Col2 Col3 date volume new_col
201601 100.5
201602 120.6 100.5
201603 450.2 120.6
201604 200.7 450.2
201605 121.4 200.7`
Teraz chcę dodać nową kolumnę z nazwą (new_col) z jednym rzędem przesuwany w dół, jak pokazano powyżej.
Spróbowałem poniżej opcji, aby użyć funkcji okna.
val windSldBrdrxNrx_df = df.withColumn("Prev_brand_rx", lag("Prev_brand_rx",1))
Czy ktoś może mi pomóc, jak to zrobić.
@Ramesh do Spark 2.0, użytkownicy musieli używać 'HiveContext' zamiast' SQLContext' do stosowania funkcji okna. 'HiveContext' jest tworzony w ten sam sposób, co' SQLContext', przekazując instancję 'SparkContext'. Jeśli dobrze pamiętam, musisz również dołączyć 'org.apache.spark: spark-hive_2.10' z odpowiednią wersją do swojej dystrybucji Spark. –
@msrinivas, Dziękuję, że odpowiedź jest prawidłowa. – Ramesh