Chcę utworzyć tabelę Hive, w której wejściowe pliki tekstowe są wykonywane na wielu podkatalogach w formacie hdf. Więc przykład mam w HDFS:Hive: Tworzenie tabeli z wieloma plikami z wieloma katalogami
/testdata/user/Jan/part-0001
/testdata/user/Feb/part-0001
/testdata/user/Mar/part-0001
and so on...
jeśli chcę utworzyć użytkownika tabeli w ulu, ale mają być w stanie przemierzać podkatalogów z obsługą, może to zrobić? Próbowałem czegoś takiego, ale nie działa;
CREATE EXTERNAL TABLE users (id int, name string)
STORED AS TEXTFILE LOCATION '/testdata/user/*'
Myślałem, że dodanie symbolu wieloznacznego będzie działało, ale nie działa. Kiedy próbowałem nie używać wildcard nadal nie działa. Jeśli jednak skopiuję pliki do katalogu głównego użytkownika, to działa. Czy nie ma sposobu, by Hive przemieściło się do katalogów-dzieci i złapało te pliki?
To nie zadziałało. Właściwie powinienem był wspomnieć, że mam teraz CDH3u1. – user706794
Definiuj "Nie działa". Powinienem też wspomnieć o konieczności zmiany nazw katalogów na month = Jan etc ... –