Podsumowanie:
Czy jest możliwe:Czy można odczytać dane MongoDB, przetworzyć je za pomocą Hadoop i wyprowadzić do RDBS (MySQL)?
- dane zaimportować do Hadoop z «MongoDB Connector for Hadoop».
- Przetwarzaj za pomocą Hadoop MapReduce.
- Wyeksportuj go za pomocą Sqoop w ramach jednej transakcji.
Jestem budowania aplikacji WWW z MongoDB. Podczas gdy MongoDB działa dobrze dla większości prac, w niektórych częściach potrzebuję silniejszych gwarancji transakcyjnych, dla których używam bazy danych MySQL.
Moim problemem jest to, że chcę przeczytać dużą kolekcję MongoDB do analizy danych, ale rozmiar kolekcji oznacza, że przetwarzanie zadania analitycznego zajmie zbyt dużo czasu. Niestety, wbudowana w MongoDB struktura redukcji map nie będzie działać dobrze w tym zadaniu, więc wolałbym przeprowadzić analizę z Apache Hadoop.
Rozumiem, że możliwe jest odczytywanie danych z MongoDB do Hadoop za pomocą «MongoDB Connector for Hadoop», który odczytuje dane z MongoDB, przetwarza je za pomocą MapReduce w Hadoop, i ostatecznie wysyła wyniki z powrotem do bazy danych MongoDB.
Problem polega na tym, że chcę, aby dane wyjściowe MapReduce trafiały do bazy danych MySQL, a nie do MongoDB, ponieważ wyniki muszą zostać połączone z innymi tabelami MySQL.
W tym celu wiem, że Sqoop może eksportować wynik Hadoop MapReduce do MySQL.
Ostatecznie, chcę zbyt przeczytać dane MongoDB, a następnie przetworzyć je za pomocą Hadoop i ostatecznie wyprowadzić wynik do bazy danych MySQL.
Czy to możliwe? Jakie narzędzia są dostępne, aby to zrobić?
Twoje pytanie może być znacznie wyraźniejsze. Wcale nie jestem pewien, co próbujesz zrobić. Zmienię twoje pytanie, aby odzwierciedlić to, co myślę, że próbujesz powiedzieć, ale twoje wyjaśnienie też byłoby pomocne. – brice
Uaktualniam moje pytanie, aby uzyskać wyjaśnienie. – paganotti
zajrzyj do mojej zaktualizowanej odpowiedzi, która powinna wyjaśnić, w jaki sposób możesz zrobić to, o co prosisz. – brice