5Ciepło
2Odpowiedz
SparkSQL - odczytać pliku parkiet bezpośrednio
12Ciepło
1Odpowiedz
Schemat ewolucji w formacie parkietowym
7Ciepło
1Odpowiedz
Spark SQL: Dlaczego dwa zadania dla jednego zapytania?
5Ciepło
2Odpowiedz
Spark SQL - różnica między formatami kompresji gzip vs snappy vs lzo
5Ciepło
1Odpowiedz
Dlaczego wydajność zapytania różni się w kolumnach zagnieżdżonych w Spark SQL?
12Ciepło
2Odpowiedz
Jak podzielić i napisać DataFrame w Spark bez usuwania partycji bez nowych danych?
5Ciepło
1Odpowiedz
Jak ustawić spark.sql.parquet.output.committer.class w pyspark
5Ciepło
1Odpowiedz
Wsparcie dla parkietu jako format wejścia/wyjścia podczas pracy z S3
13Ciepło
1Odpowiedz
Generowanie metadanych dla plików parkietu
18Ciepło
1Odpowiedz
Dlaczego Apache Spark odczytuje niepotrzebne kolumny parkietu w strukturach zagnieżdżonych?