Distributed Message Queue

김견·2023년 4월 23일

분산 메세지 큐

요약

최근 몇 년 동안 MSA 아키텍처이 일반화되면서 분산 시스템이 일반적인 상황이 되었으며 서버간의 통신이 잦아지게 되었습니다. 또한 대용량의 데이터를 처리하고 실시간 처리를 지원하고 서버 간의 통신의 신뢰성이 보장될 필요가 생겼습니다. 이 블로그 포스팅에서는 이러한 분산 시스템 상황에서 필수적으로 사용 되는 컴포넌트인 MQ(Message Queue)에 대해서 설명하고자합니다. Single Message Queue의 한계, 그로 인해 등장한 Distributed MQ의 장점과 단점에 대해 설명하려고합니다. 추가적으로 모니터링 해야하는 요소를 간략하게 다뤄보겠습니다.

Single Message Queue

Limitation

RabbitMQ, Redis와 같은 Single Message Queue는 단일 시스템의 용량 제한으로 인해 제한된 양의 데이터를 처리할 수 있습니다. Single MQ의 한계는 다음과 같습니다.

Fault Tolerance 및 HA(High Availability) 능력이 부족하여 서버 다운에 취약
- Queue Mirroring같은 기술로 등 방식을 통해 stand-by를 구현하여 장애시간을 최소화 할 수 있지만 설계 상으로 원래 clustering을 지원하지 않기 때문에 부족합니다.
성능 증가를 위해 Scale-Up을 해야하는데 비용이 많이 듦
- 단일 서버기 때문에 단일 서버의 메모리와 I/O Disk 처리량은 한계가 있기 때문이다.
단일 서버의 성능 한계가 있음
- MQ는 빠른 처리를 위해 Memory 사용, down 시 복구를 위한 event(task)를 파일로 기록(Disk I/O)
- 하는데 결국 단일 서버의 리소스를 가지고 하기에 단일 서버의 리소스의 한계와 MQ의 한계는 직결된다.

이러한 Single MQ의 한계를 극복하고 고가용성의 서비스와 지속적으로 확장 가능한 서비스를 만들기 위해서는 Distributed MQ가 필수입니다. 따라서 대용량의 데이터 처리의 필수 요소인 EDA에서는 Fault Tolerance, HA, High Scalability이 보장되는 Distributed MQ가 필요합니다.

Usage

Single MQ는 높은 Throughput 이나 Fault Tolerance가 필요하지 않은 소규모 애플리케이션에 적합합니다.

이러한 기능이 필요가 없는 서비스 규모가 작은 회사에서 무리하게 Distributed MQ를 쓴다면 이는 Over-Engineering이고 소프트웨어의 복잡성이 올라갈 뿐만아니라 값비싼 하드웨어가 필요합니다. 이는 어마어마한 비용이 필요하므로 개인의 개발 커리어 욕심 때문에 무리하게 도입하지 않도록 주의가 필요합니다.

Type of Single MQ

Rocket MQ, ActiveMQ, Redis, RabbitMQ와 같은 다양한 MQ가 존재합니다. 이 중에서 많이 화두가 되는 Redis와 RabbitMQ에 대해 설명을 하겠습니다.

결론부터 말씀드리면 단일 MQ로써 선택지는 RabbitMQ 밖에 없습니다.

Redis는 MQ의 기능을 하기 부족한 것이 때문인데 가장 큰 문제는 Message가 도착지에 도착한 것을 보장할 수 없습니다. Redis는 기본적으로 Queue에 들어온 event를 Disk에 저장하지 않기 때문에 message의 손실과 복구 기능이 부족합니다. 물론 최근들어 영속성 기능이 추가 되었지만 성능이 좋지 않아 사용하기에는 무리가 있습니다.