SRE 썸네일형 리스트형 [Security Tools 리뷰룸] Prometheus Alertmanager – 알림 폭탄을 막고 “제대로” 온콜 운영하는 라우팅/그룹핑/사일런스 실무 가이드 ✅ Prometheus와 Grafana로 메트릭 수집과 대시보드를 만들었다면, 다음 단계는 거의 항상 “알림 운영”입니다. 실제 장애는 대시보드를 ‘보고 있을 때’만 발생하지 않습니다. 결국 실무에서 중요한 건 언제/누구에게/어떤 형태로 알림이 전달되고, 중복 알림 폭탄을 어떻게 줄이며, 조치 가능한 알림만 남기는지입니다. 🔐이번 [Security Tools 리뷰룸]에서는 Prometheus 생태계의 알림 허브인 Alertmanager를 “운영 기준”으로 정리합니다. 단순 설치가 아니라, 라우팅 트리 설계, 그룹핑/반복주기 튜닝, Inhibition(억제), Silence(사일런스), 템플릿 메시지 표준화까지 포함해 실제로 운영이 굴러가게 만드는 방법에 집중합니다. ✅특히 보안/클라우드 운영 환경에서는 장.. 더보기 이전 1 다음