Django 서버에 흔히들 많이 사용하는 cachetools 로 로컬캐싱이 도입되었다. 한 이틀 정도 지났을까. 에러가 점점 발생한다.
주말에는 대응이 어렵다보니 버즈빌은 금요일은 핫픽스가 아닌 이상 배포하지 않는 정책을 운영중이다.오전에 전사에 두 건의 배포만 있었는데 오후부터 아래와 같은 에러들이 발생하기 시작했다.카프카 produce 를 위해 Avro binary format으로 Serialize
사내 Golang server 에서 goroutine 과 channel 을 사용하여 goroutine leak 이 발생하고 있었고 이를 해결된 케이스를 다루고자 합니다.
kafka producer client에서 동기로 produce하는 로직을 비동기로 변경하였습니다. 일 기준 약 5,000만건 이상의 트래픽에 약 0.5s 가량의 latency를 줄여 일 약 6900시간 이상 유저들의 시간을 절약할 수 있었습니다.
이번주 목요일에 있었던 장애로 업무일기(?) 를 남긴다. 어찌보면 너무나 당연한 Title이다. 장애가 발생했으니 가장 최초 원인이 된 트리거를 찾아야한다. 마이크로 서비스 환경이 깔끔하게 분리가 되어있고, 각 fail 이 발생했을 때 대비가 잘 되어있으면 ...