쿠버네티스 옵저버빌리티

송인호·2022년 11월 2일
0

고객사 입장에서의 NewRelic

  • NewRelic은 “어떻게 모니터링 할것인가” 에 대해서 많이 고민을 했다

  • Resource 당 모니터링 기준 제안 → 수치화 된 모니터링 정책 수립가능

  • 공식 Terraform 제공

  • 고객사인 Groundx는 자사에서 사용하는 Golang을 사용할수 있는점, Community가 크고, APM Infrastructure가 매력적이라는 점 때문에 사용한다고 한다.

  • 고객사인 숨고는 비용절감측면에서 엄청난 편리성을 받아서 사용중이다

옵저버빌리티의 특징

  • Prometheus 메트릭을 분석하여 한곳에서 모니터링 해 다양한 문제상황에 대한 대응을 할 수 있음
  • SLA이슈: 어떤 문제가 어느 상황에 있었는지 모두 알 수 있음, 따라서 의사결졍에 큰 도움을 줌
  • Pixie라는 오픈소스를 이용하여 쉽게 코드없이 계측할 수 있음
  • 가이드가 포함된 간단한 설치로 편의성을 제공
  • 좋은 UX가 좋은 서비스를 만든다

뉴렐릭의 방향

Monolithic Architecture -> Orchestrated Application Architecture 로 시대가 변화해 가는데 어떻게 K8s를 모니터링 할 것인가를 고민함

옵저버빌리티 강점

  • 다차원 가시성을 제공하여 복잡성을 제거
  • 빠르고 효과적인 큐레이션 뷰 & 컨텍스트 제공
  • 비용 최적화
    다른 경쟁사는 vm,instance 갯수로 과금을 하여 비용을 절감
    뉴렐릭은 Data ingest + 관리자 사용자 수에 따라 비용이 청구됨
  • 뉴렐릭은 데이터 쿼리언어 NRQL(New Relic Query Language)를 따로 지원하여 사용

대시보드

  • 6각형 모양의 노드를 볼 수 있어 각각의 클릭을 하여 세부사항을 확인 가능(문제 해결 용)
  • 대시보드는 만들어진 것을 사용할 수 있고, NRQL query를 수정하여 대시보드를 커스터마이징 할 수 있음

분산 Tracing

  • 해당 클러스터에서 다른 곳이랑 어떤 Http통신을 하고 있는지 검색함
  • 사용하는 Opentelemetry가 있다면 newrelic이랑 연결하는게 쉬움
  • Pods가 다른 ORM에 어떻게 연관이 되어있는지 Slow Query가 발생했으면, 어디서 발생했는지 알려줌
  • 느려진 부분이 존재하면, 해당 문제를 해결하기 위해 Log를 제공하여, 느려진 부분을 다시 해결하기위한 다양한 서비스도 제공함
  • 즉 트레이스에 관련된 로그 정보도 쉽게, 세부적으로 보여줌으로 MTTR을 줄일 수 있음

Events

  • 여기서의 event는 진짜 사고
  • OOM이 떳다던가, 서비스가 갑자기 터졌다던가 하는 부분만 따로 모아둠

Pixie(Opensource)

  • eBPF 형식
  • eBPF형식을 쓰고, 이 데이터는 유저 데이터소스에 존재하여 데이터 유실에 대한 걱정은 안해도 되며 해당 부분에 대한 과금을 하지 않음
  • 데몬셋 형태로 존재함
  • Pixie Script 를 제공해 유저한테 편하게 만듬
profile
프론트엔드 개발자

0개의 댓글