Jak mogę wstawić katalog zastępczy ze schematem json?Ukryj katalog nadpisywania wstawiania w formacie json
Istnieje surowy stół avro ula; (jest to faktycznie ma wiele pól)
tb_test--------
name string
kickname string
-----------------
następnie chcę, aby zapisać wynik kwerendy do jakiegoś katalogu, w HDFS przez jsonserde.
Próbowałem tego.
insert overwrite directory '/json/'
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
WITH SERDEPROPERTIES (
"stat_name"="$._col0",
"stat_interval"="$._col1"
)
STORED AS TEXTFILE
select name, nickname
from tb_test limit 100
Ale napisane json w/json/ma nazwę pola _colXX zamiast nazwy pola początkowego.
{"_col0":"basic_qv"," _col1":"h"}
{"_col0":"basic_qv","_col1 ":"h"}
{"_col0":"basic_qv","_col1 ":"h"}
{"_col0":"basic_qv"," _col1":"h"}
{"_col0":"basic_qv","_col1 ":"h"}
Spodziewałem
{"name":"basic_qv","nickname":"h"}
{"name":"basic_qv","nickname":"h"}
{"name":"basic_qv","nickname":"h"}
{"name":"basic_qv","nickname":"h"}
{"name":"basic_qv","nickname":"h"}
Co to pomoże?
Dzięki!
Mam podobny problem z formatem AVRO. Znalazłeś rozwiązanie? Daj mi znać, jeśli znasz jakieś obejścia. – Munesh
jest w formacie wyjściowym fotmar lub tabeli? Nie mogłem znaleźć żadnego obejścia w ulu. Zamiast tego zrobiłem to przez iskrę. Uruchom iskr sql, a następnie wyeksportuj ramkę danych jako json. iskra obsługuje różne formaty eksportu w naturze. –
AVRO jest wymaganym formatem pliku wyjściowego. Tak, Spark jest dobrym rozwiązaniem. – Munesh