Przechowywanie danych do SequenceFile z Apache Pig

Apache Pig może wczytać dane z plików sekwencyjnych Hadoop użyciu skarbonka SequenceFileLoader:Przechowywanie danych do SequenceFile z Apache Pig

REGISTER /home/hadoop/pig/contrib/piggybank/java/piggybank.jar;

DEFINE SequenceFileLoader org.apache.pig.piggybank.storage.SequenceFileLoader();

log = LOAD '/data/logs' USING SequenceFileLoader AS (...)

Czy tam również biblioteka które pozwoliłyby zapisywać pliki sekwencji Hadoop od Pig?

Źródło

2010-03-11 asquithea

To tylko kwestia wdrożenia StoreFunc, aby to zrobić.

Jest to możliwe teraz, chociaż stanie się nieco łatwiejsze, gdy pojawi się Pig 0.7, ponieważ zawiera kompletny przeprojektowanie interfejsów Load/Store.

W „Hadoop Dodatek” Twitter ~~ma zamiar otworzyć źródło~~ obejmuje otwartych źródeł w github, kod do generowania obciążenia i przechowywać funcs na podstawie protokołów Google bufory (budynku na wejścia/wyjścia dla formatów sam - już ty oczywiście te pliki sekwencji. Sprawdź, czy potrzebujesz przykładów, jak zrobić mniej trywialne rzeczy. Powinno być jednak dość proste.

Źródło

2010-03-12 12:24:13 SquareCog

To wydawało się działać dla mnie. https://github.com/kevinweil/elephant-bird/pull/73

Źródło

2012-05-31 22:07:06 qqz

Przechowywanie danych do SequenceFile z Apache Pig

Odpowiedz

Powiązane problemy