서비스 수준 계약(SLA)은 공급 업체가 고객에게 제공하기로 약속한 서비스 수준을 명시하는 아웃소싱 및 기술 공급 업체 계약입니다. 이 계약에는 가동 시간, 납품 시간, 응답 시간 및 해결 시간 등의 지표가 포함되어 있습니다. 또한 SLA는 추가 지원 또는 가격 할인 등 요구 사항이 충족되지 않았을 경우의 조치가 설명되어 있습니다.
Cloud SQL Service Level Agreement SLA | Google Cloud
서비스 레벨 목표(SLO)는 시스템에서 기대하는 가용성에 대한 목표로, 일정 기간 동안의 백분율로 표시됩니다. 즉 SLO는 SLA를 충족하기 위해 달성해야 하는 목표라고 할 수 있습니다.
DownTime에 대한 정의를 서비스 전체가 아닌 주요 프로세스로 설정
간헐적인 장애는 DownTime 인정X
Example
Azure mysql, AWS RDS - 1분 간 DB Server에 날린 모든 request가 오류를 반환할 때 해당 1분을 DownTime으로 인정
AWS EKS 클러스터의 Kubernetes 엔드 포인트에 대한 모든 요청이 5분 간격 동안 실패함을 의미함.
서비스의 SLA를 정의하기 위한 프로세스를 두가지로 나누어 정리해보았습니다.
마케팅을 효과와 어플리케이션의 안정성 등을 고려해 99.9%로 보증 가용률 설정
DeviceManager의 경우 AWS EKS 위에서 운영됩니다. AWS가 제공하는 EKS의 SLA가 99.9%이기에 AWS EKS장애를 SLA에 포함한다면, 99.9%를 보증할 수 없습니다.
그렇기에 AWS EKS장애를 포함한 Mayf Company이 컨트롤하지 못하는 원인으로 인한 장애는 제외 사항으로 지정합니다.
패치 횟수가 많은 경우 99.9%를 보증하기 힘들기에 예정된 서비스 다운은 제외 사항으로 지정합니다.
제외 사항을 포함해도 99.9%는 월 허용 가동 중지 시간(오류 예산)이 21분밖에 되지 않기에 DownTime에 대한 계산 단위를 5분으로 하고, 정의를 5분 간 Device정보 요청에대한 모든 요청이 실패하였을 때 해당 5분을 Downtime으로 정의한다.
이 경우 연속되지 않은 요청 실패는 Downtime에 포함되지 않고, 비록 연속되었을지라도 Device정보 요청에 대한 프로세스가 아니거나 5분 미만일 경우는 Downtime에 포함되지 않아 99.95% 가용률을 달성하는데 수월하다.
일반적으로 SLA에서 명시된 보증 가용률보다 SLO를 높게 설정합니다.
SLA는 고객에게 제공이 되는 계약이고, 이를 준수하지 못할 시 보상을 해야하기에 보통의 경우에 여유있게 설정을 합니다.
그에 반면에 SLO는 내부 목표로 많이 사용이 됩니다.
SLA에 명시된 보증 가용률보다 타이트하게 SLO를 설정하여, 고객에게 보상을 해야 하는 가용률 보다 높은 가용률을 유지하는 것이 하는 것이 일반적입니다.
이는 SLA 미준수로 인한 보상 확률을 줄입니다. 또한 추후 SLA 보증 가용률을 증가 시킬 수 있는 가능성을 열어주기도 합니다.
본 Mayf Company 서비스 수준 약정(이하 본 SLA)은 Mayf Company 서비스(이하 본 서비스)를 사용하는 각 계정에 적용됩니다. 본 SLA는 서비스 이용약관의 일부를 구성하고 본 SLA에 규정되지 않은 내용은 서비스 이용약관에 따르며, 상충되는 내용이 있을 경우에는 본 SLA가 우선합니다.
본 SLA에서 포함되는 서비스
회사는 본 서비스에 대해 아래 설명된 월 가동률을 보장하기 위해 상업적으로 합당한 노력을 기울일 것입니다. 서비스 약정을 충족하지 않는 경우 아래에 설명된 대로 서비스 라이선스를 받으실 수 있습니다.
서비스 라이선스는 청구 주기 동안 서비스의 가동률이 보장된 수준 미만일 경우 아래 표에 나와있는 범위에 따라 사용자가 해당 서비스에 지불한 월 요금의 백분율로 계산됩니다.
월 가동률이 미달 되지 않은 다른 서비스에 대해서는 별도의 보상이 제공되지 않습니다.
월 가동률 | 서비스 라이선스 백분율 |
---|---|
99.0% 이상 ~ 99.9% 미만 | 5% |
95.0% 이상 ~ 99.0% 미만 | 10% |
99.5% 미만 | 20% |
발급 받은 서비스 라이선스는 가동률이 미달 된 서비스 외에 서비스에 대해서는 사용이 불가능합니다.
또한 서비스 라이선스는 타 계정으로 양도 혹은 환불이 불가능합니다. 즉 당사와 별도의 계약을 맺지 않는 이상 월 보장 가동률을 지키지 못하였을 때, 사용자가 받을 수 있는 유일한 보상 방법은 본 SLA약관에 따라 서비스 라이선스를 수령하는 것 입니다.
서비스 라이선스를 발급 받기 위해서는 고객센터에 아래 내용이 기재된 요청서를 제출해야 합니다. 서비스 라이선스 요청 유효 기간은 장애 발생 후 60일입니다.
당사는 해당 요청 검토 후 보상 지급 여부를 결정합니다. 필요한 경우, 추가 문서 또는 증거가 요청될 수 있습니다.
보상 승인 시 승인 시기로부터 다음 청구 주기 내로 서비스 라이선스를 발행합니다.
요청서 상에 위에서 요구한 내용이 기재되어있지 않은 경우 해당 요청서는 유효하지 않습니다.
장애 발생 후 60일 지나서 접수된 요청서는 유효하지 않습니다.
아래에 명시되어 있는 상황은 SLA에서 보장하는 월 가동률에 영향을 주지 않습니다.