Potrzebuję funkcji okna, która partycje przez niektóre klucze (= nazwy kolumn), zamówienia przez inną nazwę kolumny i zwraca wiersze z najwyższym x rangi.Jak używać polecenia orderby() w porządku malejącym w funkcjach okna Spark?
Działa to dobrze dla porządku rosnącym:
def getTopX(df: DataFrame, top_x: String, top_key: String, top_value:String): DataFrame ={
val top_keys: List[String] = top_key.split(", ").map(_.trim).toList
val w = Window.partitionBy(top_keys(1),top_keys.drop(1):_*)
.orderBy(top_value)
val rankCondition = "rn < "+top_x.toString
val dfTop = df.withColumn("rn",row_number().over(w))
.where(rankCondition).drop("rn")
return dfTop
}
Ale gdy próbuję go zmienić na orderBy(desc(top_value))
orderBy(top_value.desc)
lub w wierszu 4, pojawia się błąd składni. Jaka jest prawidłowa składnia?
Co jest komunikat o błędzie dostajesz? –