워커 노드의 Failure을 해결하는 방법에 대해 알아보자.
먼저 클러스터 내의 노드 상태가 Ready
상태인지 확인한다.
Not Ready
상태라면 kubectl describe
명령을 이용해 노드에 대한 세부사항을 확인한다.
각 노드는 Status
에 대한 정보를 가지고 있으며, 노드에 왜 에러가 있는지 알 수 있는 방향을 제시할 수 있다.
Status는 True, False, Unknown 중 하나의 값을 가진다.
OutOfDisk
)가 True
가 된다.MemoryPressure
)가 True
가 된다.DiskPressure
)가 True
가 된다.PIDPressure
) 플래그가 True
가 된다.Ready
) 플래그가 True
가 된다.워커 노드가 마스터와 통신을 멈추면 오류가 발생하여 이런 상태가 Unknown
이 되어 버린다.
최근 HeartBeat 필드를 확인해 노드가 Crashed 된 시간을 확인한다.
이 경우, 노드 자체의 상태를 확인한다.
노드가 고장나면 다시 올린다.