auto scale을 설명하기전 레거시 서버에 대해서 설명하겠다. 기존의 서버는 물리적으로 설치하고 필요시 추가 적으로 구매하여 설치하여 사용 하는 방식으로 사용하였다. 이러한 방식은 고객의 수요변동을 효율적으로 맞추는게 쉽지 않았다. 왜냐하면 갑작스럽게 수요가 늘어난다면 그 수요를 맞추기 위해 서버를 구매하고 설치하는 작업이 있기전 수요를 감당하지 못했고 또 수요를 감당할만한 서버 인프라를 갖추었다고 해도 갑작스럽게 수요가 줄어든다면 준비해둔 서버 인프라는 낭비에 불과하기 때문이었다. 하지만 IT리소스를 임대하는 퍼블릭 클라우드 사업으로 인해 기존 서버인프라가 갖고있던 문제를 어느정도 해결할수 있게 되었다. 퍼블릭 클라우드가 제공하는 서버를 사용하면 손쉽게 서버를 임대할수가 있다. 구매 하는 개념이 아니라서 필요시 임대량을 늘리거나 줄일수 있다는게 커다란 장점이었다.
임대 서버의 임대를 사용자가 직접 정할수 있지만, 퍼블릭 클라우드 업체는 자동화 기능을 제공하여 구지 직접 일일히 설정할 필요가 없다. 우선 로드밸런스 라는 이름의 기능은 서버의 부하를 나누는 역할을 한다. 서버가 세대정도 운영이 되고 있다면 로드밸러스는 서버들의 사용량이 적절하게 유지되게 트래픽을 분산한다. 하지만 세개로 사용자들의 트래픽을 감당할수 없게 된다면 로드밸런스는 어떠한 기준을 두고 서버를 자동으로 증축한다. 이것을 auto scaling 이라고 한다. 예를 들면 서버의 cpu가 80%가 넘는다면 로드밸런스가 이를 감지하고 서버가 과부하 걸리기전 새로운 서버를 증축하여 수요를 감당하여 고가용성이 유지되게 된다. 그리고 수요가 감소한다면 이또한 로드밸런스가 감지하고 증축되었던 서버를 다시 줄여 노는 서버가 없게 한다.