HPA는 파드에 대한 자원 사용이 늘면 파드를 더 배치하는 것이다. 참고로 vertical scaling은 실행 중인 파드에 대한 자원 할당으로 HPA와 다르다.
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: simple-hpa
spec:
maxReplicas: 10
minReplicas: 1
scaleTargetRef:
apiVersion: app/v1
kind: Deployment
name: myapp
targetCPUUtilizationPercentage: 50
or
kubectl autoscale deploy simple-hpa --cpu-percent=50 --min=1 --max=10
참고: 공식 문서