Właśnie zacząłem uczyć się Big Data, w tym czasie pracuję nad Flume. Typowy przykład, z jakim się spotkałem, to przetwarzanie tweetów (przykład z Cloudera) za pomocą Java.Używanie lokalnego systemu plików jako źródła Flume
Tylko do celów testowania i symulacji, czy mogę używać mojego lokalnego systemu plików jako źródła Flume? w szczególności niektóre pliki Excel lub CSV? Czy muszę też używać kodu Java, oprócz pliku konfiguracyjnego Flume, podobnie jak w przypadku wyodrębniania Twittera?
Czy to źródło będzie sterowane zdarzeniami, czy też będzie można je pollować?
Dzięki za twój wkład.
Zakładam, że można utworzyć niestandardowe źródło flume. Nie wiem, czy już istnieje dla lokalnego systemu plików – fdsa