- 무중단 서비스 재배치
- 무정지 서비스
- 동적 장애 감지 및 복구
무중단 서비스 재배치
시스템 중단
- 포털 서비스, 금융 서비스 등은 사용자가 상시 이용하는 기초 서비스를 제공해야 함
- 1년 365일 동작
- 사용자 접속 불능시 서비스 품질 및 신뢰도 저하
서버 재부팅 하는 이유
-> 어플리케이션을 돌리면서 메모리 공간이 중간중간 비어지는 단편화가 되는 것을 정리하기 위함
시스템이 중단되는 경우
- 사용자의 요청이 클라우드 서버가 처리 가능한 용량을 벗어난 경우
- 유지보수를 위한 일시적인 다운 타임을 필요한 경우
- 신규 물리 서버로 이관하는 경우
다운 타임
줄이기
-> 온프레미스 환경에서는 이중화 서버 구조를 구축함
-> 클라우드 환경에서는 동작중인 서버를 복제하여 이중화 구조
구조
- 새로운 물리 서버들에 있는 하이퍼바이저에 새로운 VM 생성 요구 (수평 스케일링)
- VM 생성 완료 시 기존 서버에서 동작하는 VM을 복제하여 새로운 VM으로 OS 및 프로그램을 이관
- 이때 실시간 어플리케이션은 무중단 서비스 제공 안됨
저장 시점
이 필요하기 때문
장점
- 안정적인 서비스 이관
- 원본 서버의 정비 작업 완료 시 새 VM을 원본 서버의 VM으로 다시 복제하여 다운 타임 최소화
- 사용자의 요청이 클라우드 VM 처리 가능한 용량을 벗어난 경우 로드 밸런서와 네트워크 연결이 자동으로 이루어짐
가상 디스크 이관
- 가상 서버 디스크가 로컬 스토리지 타입이거나 비공유 디스크일 때
- 가상 서버에 디스크가 원격 공유 디스크로 장착되어 있을 때
- VM 디스크가 로컬, 비공유 디스크인 경우 데이터 이관 시간이 길게 소요
- 원격 공유 디스크는 이관 시간이 적게 소요되지만 접근 속도가 느림
로컬 디스크
: OS와 서비스 구동에 필요한 코어 파일
: 자주 접근되는 데이터
공유 디스크
: 그 외 데이터
무정지 서비스
클라우드 서비스 장애의 원인
- 물리 서버의 시스템 장애
- 장비 노후로 인한 무응답
- 물리적 고장
- 물리 서버가 이중화되어있지 않는 경우 장애가 발생 시 SPOF 발생
SPOF
: 시스템 구성 요소 중 시스템 전체가 중단되는 중앙 지점 장치
지원 시스템
- 장애 방지 시스템
: 시스템의 일부의 결함, 고장이 발생하여도 정상적 혹은 부분적으로 기능을 수행할 수 있는 시스템
: 예비 자원으로 만들어두는 것
ex) 게이트웨이를 하나 더 구성
- 장애 조치 시스템
: 컴퓨터 서버, 시스템, 네트워크 등에서 이상이 생겼을 때 예비 시스템으로 자동 전환되는 기능을 수행하는 시스템
ex) 미러링