Uczę się frameworków Hadoop i MapReduce. Do tej pory odtwarzałem pliki tekstowe i przetwarzałem je, wykorzystując framework MapReduce.Hadoop i inny format danych wejściowych, takich jak obraz, dźwięk, wideo
Kiedy zacząłem MapReduce nauczyć się pierwszego popularnego przykładu znalazłem WORDCOUNT, który jest scenariuszem przetwarzania pliku tekstowego. Następnie napisałem własną logikę, aby przetworzyć niektóre pliki tekstowe i wyświetlane wyniki. Udało mi się w tej sprawie.
Ale muszę przejść do różnych formatów danych wejściowych. Ponieważ w prawdziwym świecie nie będziemy przetwarzać tylko plików tekstowych. Potrzebuję zbadać przetwarzanie w różnych formatach, takich jak obrazy, audio, wideo za pomocą ramy MapReduce. Ale staram się znaleźć trafne przykłady, które mogłyby służyć mojemu celowi. Potrzebuję przykładów i samouczków na MapReduce z różnymi formatami wejść od tekstu do wideo.
Edit:
Znaczy przeładunkowe zdjęcia, pliki wideo i audio. Nie tylko plik tekstowy.
Edycja 2:
przykład: Say Mam 10 lat .bmp obrazów (gdzie kompresji i dekompresji nie jest zaangażowany), których rozmiar jest 450GB. Muszę przeanalizować każdy obraz w folderze i powinienem wyświetlić obrazy, które są podobne (Porównując wzorzec podobieństwa pikseli). I powinienem wylistować obrazy, które zostały utworzone/zmodyfikowane pomiędzy "Od" "Do" daty. Załóżmy, że obrazy zostały utworzone/zmodyfikowane w okresie od stycznia 2013 r. Do lutego 2013 r. W tym zestawie obrazów. Jak mogę to zrobić?
Byłbym szczęśliwy, gdyby ktoś mi pomógł podróżować po właściwej ścieżce !!
Cóż, mylić my. Przepraszam za to :(Zmieniłem moje pytanie, jeszcze raz przejrzyj to. Dzięki! – BinaryMee
zobacz poprawioną odpowiedź – Tucker
Ponownie zredagowałem pytanie – BinaryMee