Niedawno wypróbowałem testową stertę Ubuntu ELK stack, aby przetestować funkcjonalność i byłem z niej bardzo zadowolony. Mój przypadek użycia do produkcji wymagałby spożywania co najmniej 100 GB dzienników dziennie. Chcę być tak skalowalny, jak to możliwe, ponieważ to 100 GB/dzień może szybko wzrosnąć, ponieważ mieliśmy więcej źródeł dziennika.Dlaczego potrzebuję brokera do mojego produkcyjnego stosu ELK + specyfikacji maszyny?
Przeczytałem kilka artykułów na temat produkcji ELK, w tym fantasic Logz.io ELK Deployment. Chociaż mam ogólne pojęcie o tym, co muszę zrobić, nie jestem pewien co do podstawowych pojęć, ile maszyn potrzebuję do tak dużej ilości danych i czy potrzebuję brokera takiego jak Redis w mojej architekturze.
Jaki jest cel brokera takiego jak Redis? W mojej instancji testowej mam wiele źródeł dziennika wysyłających logi przez TCP, syslog i forwarder logstash do mojego Logstash bezpośrednio na moim serwerze ELK (który również ma zainstalowane Elasticsearch, Nginx i Kibana z SSL).
W celu zachowania wysokiej dostępności najnowocześniejszego klastra produkcyjnego, jakie maszyny i specyfikacje są mi potrzebne w przypadku co najmniej 100 GB danych dziennie, prawdopodobnie w skali do 150 GB lub więcej w przyszłości? Planuję używać własnych serwerów. Z tego, co zbadałem, punktem wyjścia powinno być coś podobnego (zakładając, że włączam Redisa):
- Serwery 2/3 z instancją Redis + Logstash (indeksowaniem) dla każdego serwera. Dla specyfikacji mam na myśli 32 GB RAM, szybki dysk I/O 500GB może SSD, 8 rdzeni (i7)
- 3 serwery dla Elasticsearch (jest to ten, którego najbardziej nie jestem pewien) - Wiem, że potrzebuję co najmniej 3 węzły główne i 2 węzły danych, więc 2 serwery będą miały po 1 dane master/1 - będą to potężne 64 GB pamięci RAM, 20 TB, 8 rdzeni. Drugi pozostały węzeł główny może znajdować się na maszynie o niskim poziomie szczegółowości, ponieważ nie obsługuje danych.
- 2 serwery dla Nginx/Kibana - powinny to być maszyny o niewielkich rozmiarach, ponieważ są tylko serwerem WWW i interfejsem użytkownika. Czy konieczne jest tu wyrównywanie obciążenia?
EDYCJA: Planuje się prowadzenie dzienników przez 60 dni.
Jak długo zamierzasz przechowywać dzienniki? Zobacz http://stackoverflow.com/questions/30331768/logstash-elasticsearch-kibana-resource-planning dla niektórych liczb. –