wiem, że jest to starszy wątek, ale w ostatnim roku nastąpiły pewne zmiany. Porównanie hurtowni danych z Hadoop przypomina porównywanie jabłek z pomarańczami. Hurtownia danych to koncepcja: czyste, zintegrowane dane o wysokiej jakości. Nie sądzę, że zapotrzebowanie na hurtownię danych zniknie w najbliższym czasie. Z kolei Hadoop to technologia. Jest to rozproszone środowisko obliczeniowe do przetwarzania dużych ilości danych. W przeszłości hurtownie danych były zazwyczaj budowane na relacyjnych bazach danych i urządzeniach hurtowni danych. Jednak w ciągu ostatnich kilku lat pojawiły się różne ograniczenia RDBMS (rosnące koszty licencji w obliczu rosnących wolumenów danych, słabo dopasowane do celu, jakim jest sprawdzanie wykresów i hierarchii oraz przyjmowanie niestrukturalnych typów danych itp.). W tym samym czasie pojawiły się mechanizmy zapytań MPP SQL na Hadoop, takie jak Apache Drill, które teraz umożliwiają wyszukiwanie danych znajdujących się w Hadoop.
Napisałem całą serię postów na ten temat, jeśli jesteś zainteresowany wszystkimi szczegółami. Data Warehousing in the age of big data. The end of an era?