6
Co to jest opcja włączenia indeksowania z iskry?Jak używać indeksów Spark ORC?
df
.write()
.option("mode", "DROPMALFORMED")
.option("compression", "snappy")
.mode("overwrite")
.format("orc")
.option("index", "user_id")
.save(...);
Robię się .option("index", uid)
, co musiałbym tam umieścić do kolumny indeksu „user_id” od orka.
Myślę, że partitionBy utworzy nowy plik na użytkownika, zamiast tworzyć indeks. Ale jesteś tylko tym, który odpowiedział, więc daję ci nagrodę. – ForeverConfused
@ForeverConfused badam na ten temat. Damy ci wkrótce znać. – Achyuth
@Achyuth, czy znalazłeś jakieś podejście do stworzenia indeksu w pliku ORC? Nic nie znalazłem do dzisiaj. Wydaje mi się, że jedynym sposobem na wykorzystanie indeksu w pliku ORC jest użycie Hive. Proszę mnie poprawić, jeśli jest źle. Dzięki! –