<TIL> 112. Load Balancer

YUJIN LEE·2023년 5월 10일

개발log

목록 보기

103/149

Load Balancer

쏟아지는 트래픽을 여러 대의 서버로 분산시켜주는 기술.
한 곳의 서버에 모든 트래픽이 몰리는 상황을 방지.

로드밸런서는 서버에 가해지는 부하(=로드)를 분산(=밸런싱)해주는 장치 or 기술.
클라이언트와 서버풀(Server Pool, 분산 네트워크를 구성하는 서버들의 그룹) 사이에 위치하며, 한 대의 서버로 부하가 집중되지 않도록 트래픽을 관리해 각각의 서버가 최적의 퍼포먼스를 보이게 함.

Load Balancing 기능

부하 분산 처리
Load(부하) Balancing(분산)이란
컴퓨터 네트워크 기술의 일종,
둘 혹은 셋 이상의 중앙처리장치 or 저장장치와 같은 컴퓨터 자원들에게 작업을 나누는 것을 의미.
부하를 분산해 트래픽이 과도하게 몰려 서비스가 중단되는 현상을 막기 위한 기술.
-> 지연없이 작업을 처리하고 속도를 낼 수 있다.
엔드포인트 역할 제공
로드밸런서는 스케일 아웃에 대한 하나의 엔드포인트 제공
우리는 오토스케일링 그룹을 통해 다수의 인스턴스 생성(스케일 아웃)하고 관리함으로써 고가용성 확보 -> 안정적인 서비스 제공 가능

이것을 사용하는 유저 입장에서는 증설된 각각의 인스턴스는 모두 다 일종의 컴퓨터라 IP 주소를 갖고있고,
이걸 관리하기 위해서는 일일히 주소를 백업해 하나하나 접속해가며 관리해야함
따라서 ELB라는 서비스가 나옴

로드밸런서에서 트래픽을 하나의 경로로 받아 다수의 인스턴스에 분산하게 되어,
유저입장에서는 각각의 인스턴스에 일일히 접근해 관리하는게 아닌 하나의 주소로 접속해 관리 가능.
인스턴스가 떨어져나가거나 오류가 나서 트래픽을 수신하지 못할 때도 로드밸런서가 스마트하게 헬스체크나 모니터링을 해 알아서 트래픽을 전송하지 않게 하고, 새로운 인스턴스가 등록되면 자동으로 분산시킴

오토스케일링과 조합

오토 스케일링은 트래픽이 몰릴 때 인스턴스(컴퓨터) 수를 자동으로 늘림으로 서버 사이즈를 조절해 서비스가 원할히 유지되게 하며, 또한 트래픽이 적을 경우 인스턴스를 감소시켜 비용 낭비를 막아주는 서비스.
ELB는 트래픽을 오토스케일링을 통해 늘린 수만개의 인스턴스들에게 부하(트래픽)를 분산하는 서비스

즉, EC2를 보다 효과적으로 이용할 수 있게함.

로드밸런싱이 필요한 경우?

여러 대의 서버를 두고 서비스를 제공하는 분산 처리 시스템에서 필요한 기술.

Scale-up / Scale-out

Scale up

서버 자체의 성능 확장.

Scale out

기존 서버와 동일하거나 낮은 성능의 서버를 두 대 이상 증설해 운영

Scale out의 방식으로 서버를 증설하기로 결정했다면 여러 대의 서버로 트래픽을 균등하게 분산해주는 로드밸런싱이 반드시 필요.

로드밸런싱 알고리즘

라운드로빈 방식(Round Robin Method)

서버에 들어온 요청을 순서대로 돌아가며 배정.
클라이언트의 요청을 순서대로 분배해 여러 대의 서버가 동일한 스펙을 갖고 있고, 서버와의 연결(세션)이 오래 지속되지 않는 경우에 활용하기 적합

가중 라운드로빈 방식(Weighted Round Robin Method)

각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 클라이언트 요청을 우선적 배분.
주로 서버의 트래픽 처리 능력이 상이한 경우 사용되는 부하 분산 방식.

IP 해시 방식(IP Hash Method)

클라이언트의 IP 주소를 특정 서버로 매핑해 요청을 처리.
사용자의 IP를 해싱해(Hashing, 임의의 길이를 지닌 데이터를 고정된 길이의 데이터로 매핑하는 것, 또는 그러한 함수) 로드를 분배하기 때문에 사용자가 항상 동일한 서버로 연결되는 것을 보장

최소 연결 방식(Least Connection Method)

요청이 들어온 시점에 가장 적은 연결상태를 보이는 서버에 우선적으로 트래픽 배분.
자주 세션이 길어지거나, 서버에 분배된 트래픽들이 일정하지 않은 경우 적합

최소 리스폰타임(Least Response Time Method)

서버의 현재 연결 상태와 응답시간(Response Time, 서버에 요청을 보내고 최초 응답을 받을 때까지 소요되는 시간)을 모두 고려해 트래픽 배분.
가장 적은 연결 상태와 가장 짧은 응답시간을 보이는 서버에 우선적으로 로드를 배분.

부하 분산에는 L4로드밸런서와 L7로드밸런서가 가장 많이 활용

그 이유는 L4로드밸런서부터 포트(Port) 정보를 바탕으로 로드를 분산하는 것이 가능하기 때문.
한 대의 서버에 각기 다른 포트 번호를 부여하여 다수의 서버 프로그램을 운영하는 경우라면
최소 L4 로드밸런서 이상을 사용

L4? L7?

네트워크 통신 시스템은 크게 일곱 가지 계층(OSI 7 layers. 개방형 통신을 위한 국제 표준 모델)로 나뉨.
각각의 계층(Layer)이 L1 ~ L7에 해당.
상위 계층에서 사용되는 장비는 하위 계층의 장비가 갖고 있는 기능을 모두 갖고 있으며,
상위 계층으로 갈수록 더욱 정교한 로드밸런싱 가능

L4 로드밸런서

네트워크 계층(IP, IPX)이나 트랜스포트 계층(TCP, UDP)의 정보를 바탕으로 로드를 분산.
IP주소나 포트번호, MAC 주소, 전송 프로토콜에 따라 트래픽을 나누는 것이 가능

L7 로드밸런서

애플리케이션 계층(HTTP, FTP, SMTP)에서 로드를 분산하기 때문에
HTTP 헤더, 쿠키 등과 같은 사용자의 요청을 기준으로 특정 서버에 트래픽을 분산하는 것이 가능.
쉽게 말해 패킷의 내용을 확인 후 그 내용에 따라 로드를 특정 서버에 분배.
URL을 따라 부하를 분산시키거나, HTTP 헤더의 쿠키값에 따라 부하를 분산하는 등 클라이언트의 요청을 보다 세분화해 서버에 전달.

또한, L7 로드밸런서의 경우 특정한 패턴을 지닌 바이러스를 감지해 네트워크를 보호할 수 있으며, DoS/DDoS와 같은 비정상적인 트래픽을 필터링할 수 있어 네트워크 보안분야에서도 활용