350Gb (rośnie kilka GB tygodniowo) ... Wszystkie te dane muszą być udostępnione Analytics
Czy masz guru MySQL w domu? Jeśli tak, sure => po prostu utwórz i rozbuduj ten klaster MySQL. Jedynym problemem z tym rozwiązaniem nie jest to, że jest to MySQL i nie jest to, że jest to , a nie a NoSQL => jest dosłownie, ponieważ wymaga eksperta, aby go skonfigurować i zawsze być tam z boku w przypadku to musi zostać zmienione. Ale zgadnij, co => SQL jest MUCH lepsze i prostsze do analityki, niż symulacja SQL na mapie/redukującej.
Coś, co może stać się późniejszym problemem z rozwiązaniem MySQL jest Oracle. Więc upewnij się, że rozumiesz, jakie funkcje MySQL możesz używać za darmo i jakie funkcje musiałbyś zapłacić.
Jeśli masz , a nie posiadasz eksperta MySQL w domu, lub nie chcesz za nie płacić, zdecydowanie możesz skorzystać z NoSQL. Nie oznacza to, że nie potrzebujesz wiedzy o produktach NoSQL, ale konfigurowanie i uruchamianie węzłów X jako pojedynczego systemu jest niezwykle prostym i naturalnym procesem dla rozwiązań NoSQL.
Na przykład w Riaku i kilku innych bestsellerach NoSQL, większość komplikacji dystrybucji jest rozwiązywana przez produkt bez konieczności wykonywania jakichkolwiek czynności => to naprawdę jest takie proste.
Cena płacisz NoSQL traci SQL (myśleć o miłych cech agregowania) i konsystencji, która jest ewentualny, a jeśli ściśle robi Analytics, dla ciebie, spójność nie może być cena w ogóle.
W zamian otrzymujesz bardzo naturalną obsługę dużych zbiorów danych, odporność na uszkodzenia i much more.
Jeśli jesteś w przestrzeni Hadooooxyz i możesz zapłacić, spójrz na Hadapt, która obiecuje 5-krotną wydajność Hive.
Czy powinienem mieć problemy z próbą pompowania coraz większej ilości danych do mysql? – AlgoMan
Nie chodzi o ilość przechowywanych danych, ponieważ chodzi o to, jak są one wykorzystywane, oraz o to, w jaki sposób ich wykorzystanie i bazowy projekt bazy danych wpływa na wynikową wydajność/zaspokaja potrzeby biznesowe. Myślę, że moim zdaniem, (a) NoSQL nie jest w żaden sposób zamiennikiem MySQL, jest to po prostu kolejna opcja i (b) jest to "właściwe narzędzie do właściwej pracy". – jefflunt