monitoring 03 - Alertmanager

gyeongseon·2023년 4월 30일

monitoring

목록 보기

3/3

정확하게 알고 싶은 분들은 위 문서를 참고해주세요.

저는 하다보니까 이런거라고 생각 됩니다.

메트릭정보를 기준으로 알림을 보내줄 수 있는 기능 입니다.

ex. 현재 클러스터의 모든 노드들이 사용하는 cpu 코어의 % 가 90% 수준을 넘으면 slack 으로 메세지를 보낸다!

다양한 포스팅에서 가이드를 해주고 있지만 사실 어떤 글이 좋은 글인지 몰라서 북마크를 올리지 못하겠다.

그리고 git prometheus/alertmanager 을 봐도 사용법이 난이도가 있고 , 보다 체계적으로 구성하기 위해서 더더욱 난이도가 있다고 생각된다.

때문에 사용법은 본인이 이해하기 좋은 글을 찾아보는 것을 추천한다.

사용법을 정말 간단하게 말하자면

prometheus 에서 rules 들을 설정합니다. 여기서 rules이란 어떤 기준으로 알림을 보낼건지 설정하게 됩니다. 그리고 환경(clsuter , helm cart , riteral , docker , deamon …)에 따라 사용법이 많이 다릅니다.
alertmanager은 prometheus 에서 받은 알림을 누구에게 전달할건지 설정하게 됩니다. 역시나 설정하는 방법은 환경에 따라 다를 수 있습니다.
마지막은 알림을 받을 서비스가 위치하고 있습니다. ex) slack, email, server … bra bra …

저도 한 번만 연습으로 만들어봤습니다. 큰 틀에서 이런 방법이지 않을까 생각했습니다. (이건 40%만 신뢰해주세요)

경선 :)