Potrzebuję przechowywać dużą liczbę małych obiektów danych (miliony wierszy na miesiąc). Gdy zostaną zapisane, nie będą się zmieniać. Muszę:Bezpłatna hurtownia danych - Infobright, Hadoop/Hive lub co?
- przechowywać je bezpiecznie
- ich używać do analizy (głównie czasu zorientowanych)
- odzyskać niektóre dane surowe sporadycznie
- Byłoby miło, gdyby mógł być używany z JasperReports lub BIRT
Mój pierwszy strzał był Infobright Społeczność - tylko kolumna zorientowane tylko do odczytu mechanizm przechowywania MySQL
Z drugiej strony, ludzie mówią, że podejście NoSQL może być lepsze. Hadoop + Hive wygląda obiecująco, ale dokumentacja wygląda marnie, a numer wersji jest mniejszy niż 1.0.
Słyszałem o Hypertable, Pentaho, MongoDB ....
Czy masz jakieś zalecenia?
(Tak, znalazłem kilka tematów, ale to było rok czy dwa lata temu)
Edit: Inne rozwiązania: MonetDB, InfiniDB, LucidDB - Co o tym sądzisz?
Numer wersji nie jest ważny. HDFS/Hadoop działają dobrze - ale są interesujące tylko, jeśli masz kilka węzłów na dane i analizy. – Leonidas
Jeśli chcesz szybki start, polecam używanie pentaho i bazy danych obsługujących pentaho. Myślę, że odpowiedzi poniżej koncentrują się bardziej na dostępie do danych, ale w rozwoju hurtowni danych ważne są również narzędzia. – elprup
@Piotr: To jest dwuletnie pytanie bez odpowiedzi. Potrzebuję rozwiązania mającego prawie te same specyfikacje. Co zdecydowałeś się użyć na końcu? –