[Kubernetes] Kubernetes 란?

아현·2023년 1월 8일
0

Kubernetes

목록 보기
4/9

1. 쿠버네티스(Kubernetes) 란?

출처, 출처2


  • 쿠버네티스는 컨테이너를 쉽고 빠르게 배포/확장하고 관리를 자동화해주는 오픈소스 플랫폼입니다.
  • 컨테이너들을 관리해준다.

    • 컨테이너란, 우리가 구동하려는 애플리케이션을 실행할 수 있는 환경까지 감싸서, 어디서든 쉽게 실행할 수 있도록 해 주는 기술

  • 쿠버네티스의 역할

    • 컨테이너를 분산 배치, 상태 관리 및 컨테이너의 구동 환경까지 관리해 주는 도구

    도커는 컨테이너를 다루는 도구(컨테이너 런타임) 중 하나입니다.
    쿠버네티스는 컨테이너를 다루기 위해 도커 이외에도 다양한 컨테이너 런타임 소프트웨어를 사용할 수 있습니다.





가상화 환경 VS 컨테이너 환경

출처


  • 가상 머신 (Virtual Machine , VM)

    • VM의 구현 방법에 따라 다르지만, 기본적으로 하이퍼바이저가 여러개의 VM을 띄우고 실행한다.

      • 이때 중요한 것은 각 VM마다 독립된 실행 환경을 제공한다는 것이다.

      • 즉 VM1과 VM2가 동일한 OS를 사용한다고 하더라도, 데이터는 물론이고 코드도 전혀 공유하여 사용하지 않는다.

    • 이로 인해 각 VM마다 최소 GB 단위의 공간이 필요하며, VM 수에 비례해서 늘어나게 된다.

    • 퍼포먼스 오버헤드도 상당하다. 하드웨어까지 가상화하는 전가상화(full-virtualization)이냐 그렇지 않은 반가상화(para-virtualization)이냐에 따라 다르지만, 보통 부팅 시에 상당한 시간이 소요된다.

  • 전가상화의 느린 속도를 보완하기 위해 현재는 반가상화 방식으로 퍼포먼스를 제공하나 아직은 리얼 머신에 비해 느리다.
    • 예를 들면 VMware, Virtual Box 와 같이 Host OS 위에 Guest OS를 가상화 하는 방식인데, 예전에는 Guest OS 전체를 가상화했고 이 방식은 간단하지만 무겁고 느려 운영환경에는 적용하기 어려웠다.
    • 그래서 현재는 Xen 과 같은 반가상화 방식으로 구성된다.



  • 컨테이너 ( Container )

    • 무겁고 느린 가상화방식을 해결하기 위해 프로세스를 격리하는 방안이 등장했다.

    • 컨테이너화는 커널 하나에 격리된 여러 개의 사용자 공간 인스턴스가 포함 될 수 있도록 애플리케이션 수준에서 이루어지는 가상화의 일종이다.

      • 이런 인스턴스를 컨테이너라고 부른다.
    • 컨테이너는 애플리케이션 코드, 런타임, 시스템 도구, 시스템 라이브러리 및 구성을 하나의 인스턴스에 패키징하는 기본적인 방법을 제공한다. 컨테이너는 하드웨어에 설치된 커널(운영 체제) 하나를 공유한다.

    • Docker의 컨테이너는 독립된 실행환경을 제공하지 않는다.

      • 즉 OS의 많은 자원들을 컨테이너들끼리 공유한다(높은 이동성) 덕분에 부팅시간이 훨씬 짧고, 컨테이너 개수가 늘어나더라도 디스크 공간을 많이 차지하지 않는다.

      • 또한, 컨테이너가 완전히 독립된 실행환경을 제공하지 않고 공유한다고 하더라도, 각 컨테이너 내의 프로세스들은 이를 감지하지 못하고, 자신이 OS의 모든 자원을 독점하고 있다고 생각한다.





쿠버네티스 배포 종류


  • 쿠버네티스는 Deployment, StatefulSets, DaemonSet, Job, CronJob등 다양한 배포 방식을 지원합니다.

    • Deployment는 새로운 버전의 애플리케이션을 다양한 전략으로 무중단 배포할 경우 사용

    • StatefulSets은 실행 순서를 보장하고 호스트 이름과 볼륨을 일정하게 사용할 수 있어 순서나 데이터가 중요한 경우 사용

    • DaemonSet은 로그나 모니터링 등 모든 노드에 설치가 필요한 경우 사용

    • Job이나 CronJob을 이용하여 배치성 작업의 경우 사용

  1. 관리형 쿠버네티스
  2. 설치형 쿠버네티스
  3. 구성형 쿠버네티스



Ingress 설정


  • 다양한 웹 애플리케이션을 하나의 로드 밸런서로 서비스하기 위해 Ingress입장 기능을 제공

  • 웹 애플리케이션을 배포하는 과정을 보면 외부에서 직접 접근할 수 없도록 애플리케이션을 내부망에 설치하고 외부에서 접근이 가능한 ALB나 Nginx, Apache를 프록시 서버로 활용 가능하다.

    • 프록시 서버는 도메인과 Path 조건에 따라 등록된 서버로 요청을 전달하는데 서버가 바뀌거나 IP가 변경되면 매번 설정을 수정이 필요하다.

      • 쿠버네티스의 Ingress는 이를 자동화하면서 기존 프록시 서버에서 사용하는 설정을 거의 그대로 사용할 수 있다.
    • 새로운 도메인을 추가하거나 업로드 용량을 제한하기 위해 일일이 프록시 서버에 접속하여 설정할 필요가 없다.

  • 하나의 클러스터에 여러 개의 Ingress 설정을 할 수 있어 관리자 접속용 Ingress와 일반 접속용 Ingress를 따로 관리할 수 있다.



클라우드 지원


  • 쿠버네티스는 부하에 따라 자동으로 서버를 늘리는 기능AutoScaling이 있고 IP를 할당받아 로드밸런스LoadBalancer로 사용할 수 있습니다.

  • 외부 스토리지를 컨테이너 내부 디렉토리에 마운트하여 사용하는 것도 일반적

    • 이를 위해 클라우드 별로 적절한 API를 사용하는 모듈이 필요합니다.

    • 쿠버네티스는 Cloud Controller를 이용하여 클라우드 연동을 손쉽게 확장할 수 있습니다.



Namespace & Label


  • 하나의 클러스터를 논리적으로 구분하여 사용할 수 있습니다.

  • 하나의 클러스터에 다양한 프레임워크와 애플리케이션을 설치하기 때문에 기본(system, default)외에 여러 개의 네임스페이스를 사용하는 것이 일반적입니다.

  • 세부적인 설정으로 라벨 기능을 적극적으로 사용하여 유연하면서 확장성 있게 리소스를 관리할 수 있습니다.



RBAC (role-based access control)


  • 접근 권한 시스템입니다.

  • 각각의 리소스에 대해 유저별로 CRUD스런 권한을 손쉽게 지정 가능

  • 클러스터 전체에 적용하거나 특정 네임스페이스에 적용할 수 있습니다.

  • AWS의 경우 IAM을 연동해서 사용할 수도 있습니다.



CRD (Custom Resource Definitaion)


  • 쿠버네티스가 제공하지 않는 기능을 기본 기능과 동일한 방식으로 적용하고 사용할 수 있습니다.

    • 예를 들어, 쿠버네티스는 기본적으로 SSL 인증서 관리 기능을 제공하지 않지만, cert-manager를 설치하고 Certificate 리소스를 이용하면 익숙한 쿠버네티스 명령어로 인증서를 관리할 수 있습니다.

      • 또 다른 도구, 방식을 익힐 필요 없이 다양한 기능을 손쉽게 확장할 수 있습니다.



Auto Scaling


  • CPU, memory 사용량에 따른 확장은 기본이고 현재 접속자 수와 같은 값을 사용할 수도 있습니다.

  • 컨테이너의 개수를 조정하는 Horizontal Pod Autoscaler(HPA), 컨테이너의 리소스 할당량을 조정하는 Vertical Pod Autoscaler(VPA), 서버 개수를 조정하는 Cluster Autosclaer(CA) 방식이 있습니다.



Federation, Multi Cluster


  • 클라우드에 설치한 쿠버네티스 클러스터와 자체 서버에 설치한 쿠버네티스를 묶어서 하나로 사용할 수 있습니다.

  • 구글에서 발표한 Anthos를 이용하면 한 곳에서 여러 클라우드의 여러 클러스터를 관리할 수 있습니다.



2. 쿠버네티스 기본 개념


Desired State


  • 쿠버네티스에서 가장 중요한 것은 desired state - 원하는 상태 라는 개념

    • 원하는 상태: 관리자가 바라는 환경을 의미하고 좀 더 구체적으로는 얼마나 많은 웹서버가 떠 있으면 좋은지, 몇 번 포트로 서비스하기를 원하는지 등
  • 쿠버네티스는 복잡하고 다양한 작업을 하지만 자세히 들여다보면 현재 상태 current state를 모니터링하면서 관리자가 설정한 원하는 상태를 유지하려고 내부적으로 이런저런 작업을 하는 단순한 로직을 가지고 있습니다.

    • 관리자가 서버를 배포할 때 직접적인 동작을 명령하지 않고 상태를 선언하는 방식을 사용합니다.

    • 예를 들어 “nginx 컨테이너를 실행해줘. 그리고 80 포트로 오픈해줘.”는 현재 상태를 원하는 상태로 바꾸기 위한 명령(imperative)이고 “80 포트를 오픈한 nginx 컨테이너를 1개 유지해줘”는 원하는 상태를 선언(declarative) 한 것입니다.


$ docker run # 명령
$ kubectl create # 상태 생성 (물론 kubectl run 명령어도 있지만 잘 사용하지 않습니다)



Kubernetes Object


  • 쿠버네티스는 상태를 관리하기 위한 대상을 오브젝트로 정의합니다.

  • 기본으로 수십 가지 오브젝트를 제공하고 새로운 오브젝트를 추가하기가 매우 쉽기 때문에 확장성이 좋습니다.


  • 주요 오브젝트

    • Pod

      • 쿠버네티스에서 배포할 수 있는 가장 작은 단위

      • 한 개 이상의 컨테이너와 스토리지, 네트워크 속성을 가집니다.

      • Pod에 속한 컨테이너는 스토리지와 네트워크를 공유하고 서로 localhost로 접근할 수 있습니다.

      • 컨테이너를 하나만 사용하는 경우도 반드시 Pod으로 감싸서 관리

    • ReplicaSet

      • Pod을 여러 개(한 개 이상) 복제하여 관리하는 오브젝트

      • Pod을 생성하고 개수를 유지하려면 반드시 ReplicaSet을 사용해야 합니다.

      • ReplicaSet은 복제할 개수, 개수를 체크할 라벨 선택자, 생성할 Pod의 설정값(템플릿)등을 가지고 있습니다.

      • 직접적으로 ReplicaSet을 사용하기보다는 Deployment등 다른 오브젝트에 의해서 사용되는 경우가 많습니다.

    • Service

      • 네트워크와 관련된 오브젝트

      • Pod을 외부 네트워크와 연결해주고 여러 개의 Pod을 바라보는 내부 로드 밸런서를 생성할 때 사용합니다.

      • 내부 DNS에 서비스 이름을 도메인으로 등록하기 때문에 서비스 디스커버리 역할도 합니다.

    • Volume

      • 저장소와 관련된 오브젝트

      • 호스트 디렉토리를 그대로 사용할 수도 있고 EBS 같은 스토리지를 동적으로 생성하여 사용할 수도 있습니다.

      • 사실상 인기 있는 대부분의 저장 방식을 지원합니다.

    • Object Spec - YAML

      • 오브젝트의 명세Spec는 YAML 파일(JSON도 가능하다고 하지만 잘 안 씀)로 정의하고 여기에 오브젝트의 종류와 원하는 상태를 입력합니다.

      • 이러한 명세는 생성, 조회, 삭제로 관리할 수 있기 때문에 REST API로 쉽게 노출할 수 있습니다.

      • 접근 권한 설정도 같은 개념을 적용하여 누가 어떤 오브젝트에 어떤 요청을 할 수 있는지 정의할 수 있습니다.



apiVersion: v1
kind: Pod
metadata:
    name: example
spec:
    containers:
    - name: busybox
        image: busybox:1.25



쿠버네티스 배포방식


  • 쿠버네티스는 애플리케이션을 배포하기 위해 원하는 상태(desired state)를 다양한 오브젝트(object)에 라벨Label을 붙여 정의(yaml)하고 API 서버에 전달하는 방식을 사용합니다.

    • “컨테이너를 2개 배포하고 80 포트로 오픈해줘”라는 간단한 작업을 위해 다음과 같은 구체적인 명령을 전달해야 합니다.
      • “컨테이너를 Pod으로 감싸고 type=app, app=web이라는 라벨을 달아줘. type=app, app=web이라는 라벨이 달린 Pod이 2개 있는지 체크하고 없으면 Deployment Spec에 정의된 템플릿을 참고해서 Pod을 생성해줘. 그리고 해당 라벨을 가진 Pod을 바라보는 가상의 서비스 IP를 만들고 외부의 80 포트를 방금 만든 서비스 IP랑 연결해줘.”



3. 쿠버네티스 아키텍처


  • 컨테이너는 아주 심플하고 우아하게 동작합니다. run을 하면 실행되고 stop을 하면 멈춥니다.

  • 서버-클라이언트 구조를 안다면 컨테이너를 관리하는 에이전트를 만들고 중앙에서 API를 이용하여 원격으로 관리하는 모습을 쉽게 그려볼 수 있습니다.

  • 쿠버네티스 또한 중앙(Master)에 API 서버와 상태 저장소를 두고 각 서버(Node)의 에이전트(kubelet)와 통신하는 단순한 구조입니다.

    • 하지만, 앞에서 얘기한 개념을 여러 모듈로 쪼개어 구현하고 다양한 오픈소스를 사용하기 때문에 설치가 까다롭고 언뜻 구성이 복잡해 보입니다.



마스터-노드 구조


  • 쿠버네티스는 전체 클러스터를 관리하는 마스터와 컨테이너가 배포되는 노드로 구성되어 있습니다.

    • 모든 명령은 마스터의 API 서버를 호출하고 노드는 마스터와 통신하면서 필요한 작업을 수행합니다.

    • 특정 노드의 컨테이너에 명령하거나 로그를 조회할 때도 노드에 직접 명령하는 게 아니라 마스터에 명령을 내리고 마스터가 노드에 접속하여 대신 결과를 응답합니다.



Master


  • 마스터 서버는 다양한 모듈이 확장성을 고려하여 기능별로 쪼개져 있는 것이 특징

    • 관리자만 접속할 수 있도록 보안 설정을 해야 하고 마스터 서버가 죽으면 클러스터를 관리할 수 없기 때문에 보통 3대를 구성하여 안정성을 높입니다.

    AWS EKS 같은 경우 마스터를 AWS에서 자체 관리하여 안정성을 높였고(마스터에 접속 불가) 개발 환경이나 소규모 환경에선 마스터와 노드를 분리하지 않고 같은 서버에 구성하기도 합니다.



Node


  • 노드 서버는 마스터 서버와 통신하면서 필요한 Pod을 생성하고 네트워크와 볼륨을 설정합니다.

  • 실제 컨테이너들이 생성되는 곳으로 수백, 수천대로 확장할 수 있습니다. 각각의 서버에 라벨을 붙여 사용목적(GPU 특화, SSD 서버 등)을 정의할 수 있습니다.



Kubectl


  • API 서버는 json 또는 protobuf 형식을 이용한 http 통신을 지원합니다.

    • 이 방식을 그대로 쓰면 불편하므로 보통 kubectl이라는 명령행 도구를 사용합니다.

어떻게 읽어야 할지 난감한데 공식적으로 큐브컨트롤(cube control)이라고 읽지만 큐브씨티엘, 쿱컨트롤, 쿱씨티엘등도 많이 쓰입니다.



Master 구성 요소


  • API 서버 kube-apiserver

    • API 서버는 모든 요청을 처리하는 마스터의 핵심 모듈입니다.

    • kubectl의 요청뿐 아니라 내부 모듈의 요청도 처리하며 권한을 체크하여 요청을 거부할 수 있습니다.

    • 실제로 하는 일은 원하는 상태를 key-value 저장소에 저장하고 저장된 상태를 조회하는 매우 단순한 작업입니다.

    • Pod을 노드에 할당하고 상태를 체크하는 일은 다른 모듈로 분리되어 있습니다.

    • 노드에서 실행 중인 컨테이너의 로그를 보여주고 명령을 보내는 등 디버거 역할도 수행합니다.


  • 분산 데이터 저장소 etcd

    • RAFT 알고리즘을 이용한 key-value 저장소입니다.

    • 여러 개로 분산하여 복제할 수 있기 때문에 안정성이 높고 속도도 빠른 편입니다.

    • 단순히 값을 저장하고 읽는 기능뿐 아니라 watch 기능이 있어 어떤 상태가 변경되면 바로 체크하여 로직을 실행할 수 있습니다.

    • 클러스터의 모든 설정, 상태 데이터는 여기 저장되고 나머지 모듈은 stateless하게 동작하기 때문에 etcd만 잘 백업해두면 언제든지 클러스터를 복구할 수 있습니다.

    • etcd는 오직 API 서버와 통신하고 다른 모듈은 API 서버를 거쳐 etcd 데이터에 접근합니다.

      • k3s 같은 초경량 쿠버네티스 배포판에서는 etcd대신 sqlite를 사용하기도 합니다.

  • 스케줄러, 컨트롤러

    • API 서버는 요청을 받으면 etcd 저장소와 통신할 뿐 실제로 상태를 바꾸는 건 스케줄러와 컨트롤러 입니다.

    • 현재 상태를 모니터링하다가 원하는 상태와 다르면 각자 맡은 작업을 수행하고 상태를 갱신합니다.

    • 스케줄러 (kube-scheduler)

      • 스케줄러는 할당되지 않은 Pod을 여러 가지 조건(필요한 자원, 라벨)에 따라 적절한 노드 서버에 할당해주는 모듈입니다.
    • 큐브 컨트롤러 (kube-controller-manager)

      • 큐브 컨트롤러는 다양한 역할을 하는 아주 바쁜 모듈입니다.

        • 쿠버네티스에 있는 거의 모든 오브젝트의 상태를 관리합니다.

        • 오브젝트별로 철저하게 분업화되어 Deployment는 ReplicaSet을 생성하고 ReplicaSet은 Pod을 생성하고 Pod은 스케줄러가 관리하는 식입니다.

    • 클라우드 컨트롤러 (cloud-controller-manager)

      • 클라우드 컨트롤러는 AWS, GCE, Azure 등 클라우드에 특화된 모듈입니다.

      • 노드를 추가/삭제하고 로드 밸런서를 연결하거나 볼륨을 붙일 수 있습니다.

      • 각 클라우드 업체에서 인터페이스에 맞춰 구현하면 되기 때문에 확장성이 좋고 많은 곳에서 자체 모듈을 만들어 제공하고 있습니다.



Node 구성 요소


  • 큐블릿 (kubelet)

    • 노드에 할당된 Pod의 생명주기를 관리합니다.

    • Pod을 생성하고 Pod 안의 컨테이너에 이상이 없는지 확인하면서 주기적으로 마스터에 상태를 전달합니다.

    • API 서버의 요청을 받아 컨테이너의 로그를 전달하거나 특정 명령을 대신 수행하기도 합니다.

  • 프록시 (kube-proxy)

    • 큐블릿이 Pod을 관리한다면 프록시는 Pod으로 연결되는 네트워크를 관리합니다.

    • TCP, UDP, SCTP 스트림을 포워딩하고 여러 개의 Pod을 라운드로빈 형태로 묶어 서비스를 제공할 수 있습니다.

      • 초기에는 kube-proxy 자체가 프록시 서버로 동작하면서 실제 요청을 프록시 서버가 받고 각 Pod에 전달해 주었는데 시간이 지나면서 iptables를 설정하는 방식으로 변경되었습니다.

      • iptables에 등록된 규칙이 많아지면 느려지는 문제 때문에 최근 IPVS를 지원하기 시작했습니다.

  • 추상화

    • 컨테이너는 도커고 도커가 컨테이너라고 생각해도 무리가 없는 상황이지만 쿠버네티스는 CRI(Container runtime interface)를 구현한 다양한 컨테이너 런타임을 지원합니다.

      • containerd(사실상 도커..), rkt, CRI-O 등이 있습니다.
    • CRI 외에 CNI(네트워크), CSI(스토리지)를 지원하여 인터페이스만 구현한다면 쉽게 확장하여 사용할 수 있습니다.



4. 하나의 Pod이 생성되는 과정


  • 관리자가 애플리케이션을 배포하기 위해 ReplicaSet을 생성하면 다음과 같은 과정을 거쳐 Pod을 생성합니다.

  • 흐름을 보면 각 모듈은 서로 통신하지 않고 오직 API Server와 통신하는 것을 알 수 있습니다.

    • API Server를 통해 etcd에 저장된 상태를 체크하고 현재 상태와 원하는 상태가 다르면 필요한 작업을 수행합니다.
  • kubectl

    • ReplicaSet 명세를 yml파일로 정의하고 kubectl 도구를 이용하여 API Server에 명령을 전달

    • API Server는 새로운 ReplicaSet Object를 etcd에 저장

  • Kube Controller

    • Kube Controller에 포함된 ReplicaSet Controller가 ReplicaSet을 감시하다가 ReplicaSet에 정의된 Label Selector 조건을 만족하는 Pod이 존재하는지 체크

    • 해당하는 Label의 Pod이 없으면 ReplicaSet의 Pod 템플릿을 보고 새로운 Pod(no assign)을 생성. 생성은 역시 API Server에 전달하고 API Server는 etcd에 저장

  • Scheduler

    • Scheduler는 할당되지 않은(no assign) Pod이 있는지 체크

    • 할당되지 않은 Pod이 있으면 조건에 맞는 Node를 찾아 해당 Pod을 할당

  • Kubelet

    • Kubelet은 자신의 Node에 할당되었지만 아직 생성되지 않은 Pod이 있는지 체크

    • 생성되지 않은 Pod이 있으면 명세를 보고 Pod을 생성

    • Pod의 상태를 주기적으로 API Server에 전달



+ 퍼시스턴트 볼륨

https://kubernetes.io/ko/docs/concepts/storage/persistent-volumes/

profile
For the sake of someone who studies computer science

0개의 댓글