Mamy trzy instancje EC2 - po jednej w każdej strefie dostępności (AZ) w regionie ue-zachód-1. Są one równoważone obciążeniem za pomocą ELB. Chcielibyśmy monitorować, ile instancji jest zarejestrowanych w loadbalancerze, korzystając z CloudWatch. Problem: nie rozumiem metryki HealthyHostCount
.Jak używać urządzenia HealthyHostCount ELB do monitorowania w CloudWatch?
W przypadku wdrożenia chcielibyśmy mieć możliwość wyrejestrowania pojedynczej instancji (wyjąć ją z LB) bez powiadomienia. Tak więc alarm byłby: Powiadamiaj, jeśli tylko 1 zdrowe wystąpienie pozostało za loadbalancerem przez 5 minut.
O ile rozumiem, HealthyHostCount
(HHC) to liczba zdrowych instancji, które są zarejestrowane w danym ELB, uśrednione dla wszystkich AZ. Jeśli wszystko jest w porządku, HHC powinno wynosić 1 (bez względu na to, przez jaki okres czasu), ponieważ w każdym AZ jest 1 przypadek.
Kilka dni temu ktoś został wdrożony bez ponownej rejestracji wystąpień, więc tylko jedna instancja była zrównoważona. Kiedy to zauważyliśmy, stworzyliśmy alarm, który miał nas powiadomić, gdy średnia HHC spadła poniżej 0,6 po 5 minutach. (Jeśli w ELB zarejestrowana jest tylko jedna instancja, HHC powinna wynosić średnio 0,33 przez dowolny okres czasu.) Jednak alarm nigdy nie zmienił się na "ALARM".
Kiedy sprawdziłem HHC w CloudWatch, HHC były liczbami, które nie miały sensu (suma 10.0 na 5-minutowy interwał to wszystko, co pamiętam teraz).
To wszystko jest dla mnie wielkim bałaganem. Za każdym razem, gdy myślę, że rozumiem metrykę, wykresy CloudWatch są dla mnie bełkotem.
Czy ktoś mógłby wyjaśnić, jak użyć HHC, aby uzyskać alarm, gdy zarejestrowana jest tylko jedna instancja? Czy średnia HHC jest do zrobienia, czy powinienem użyć innej miary?
Dzięki za tym szczegółowym wyjaśnieniem i niesamowite! –