2023 회고

xgro·2023년 12월 13일

2023 devops review

DevOps

목록 보기

9/10

지난 해 동안의 성과와 도전에 대한 생각을 정리하고, 앞으로의 성장 방향을 명확히 하기 위해서 작성하였습니다.

📌 Introdution

2023년 올해의 문장!!
오늘의 나는 성장하였나?

매일은 물론 매 순간을 도전과 학습의 기회로 채우고자 한 한해였습니다.

DevOps 엔지니어로서 직무를 수행하며 새로운 기술과 도구를 터득하면서 동료들과의 협업을 통해 의미있는 결과를 만들 수 있었습니다.

📌 Action

2023년 목표는 레거시를 개선하여 클라우드 환경에서 인프라를 더욱 잘 운영할 수 있는 환경을 만들기 위해 노력하였습니다.

프로젝트를 설명하기 위한 구조는 아래의 순서를 따라 작성하였습니다.

Plan
구체적인 목표를 제시하고, 해당 목표를 달성하기 위한 계획을 설명

Project Experiences
사용한 기술 스택, 도구, 플랫폼을 나열하고, 해당 기술들을 어떻게 활용했는지에 대한 세부 정보를 제공

Issues and Challenges
마주한 기술적, 조직적 도전 과제를 솔직하게 언급하고, 어떻게 극복했는지에 대한 과정

Learning
실수와 실패에서 어떻게 배웠는지, 그리고 이를 통해 개인적 및 전체적인 성장을 이룬 부분을 기술

✅ EKS 마이그레이션

ECS에서 운영 중인 서비스를 EKS로의 마이그레이션을 진행했습니다.

회사의 서비스 확장으로 컨테이너 수가 급증하면서, ECS의 제한적 용량과 개발 환경에 따른 확장 어려움으로 인해 EKS로의 전환을 결정했습니다.

ECS 운영시 제한사항

ECS에서 허가된 용량의 컨테이너로만 운용할 수 있습니다. (제한적)

Service에 따라 다른 용량의 리소스를 필요한 경우에도 AWS에서 제한적으로 설정되어있는 리소스 용량을 할당받아 사용해야 하므로 불필요한 리소스 낭비가 발생합니다.

개발 환경에 따른 인프라 확장성을 따라가기 힘들어집니다.

하나의 서비스를 생성할때, 각각의 개발 환경(dev,stag,prod)에 맞춰 컨테이너를 생성하고 있습니다.

proxy, domain-name 역시 각각 생성해야 하고 형상 관리의 필요성 또한 커지게 되었습니다.

Plan

EKS로 마이그레이션을 통해 다음과 같은 이점을 기대하였습니다.

K8s를 통해 인프라를 직접 관리하므로 불필요한 리소스 낭비가 줄어듭니다.

최적화된 용량의 컨테이너를 직접 배포하므로 자원을 효율적으로 사용할 수 있습니다.
리소스 설치 및 연동이 간편해 집니다.

Manifest 파일로 인프라를 관리하므로 GitOps를 통해 SSOT 원칙으로 인프라를 관리할 수 있습니다.

SSOT란?
SSOT는 Single Source of Truth의 약어로, 데이터베이스, 애플리케이션, 프로세스 등의 모든 데이터에 대해 하나의 출처를 사용하는 개념을 의미합니다. 이는 데이터의 정확성, 일관성, 신뢰성을 보장하고, 일관성 있는 의사결정 및 작업 효율성을 높이는 데 도움을 줍니다 - SSOT(Single Source of Truth)란?

Project Experiences

GitOps(@ArgoCD)

EKS로 마이그레이션을 기대하며 가장 목표로 했었던 GitOps를 도입하였습니다.

서비스가 확장됨에 따라 인프라에 대한 작업을 진행하는 경우 적극적으로 작업내용을 전파해도 종종 잊어버리는 경우가 발생하곤 했습니다.

형상관리를 manifest로 선언하여 팀원과 하나의 소스코드로 인프라를 관리할 수 있게 되었습니다!

Karpenter

카펜터를 도입하여 실제 서비스를 운영하는 Pod가 배포되는 Node를 자동으로 관리할 수 있도록 구성할 수 있었습니다.

EKS와 카펜터를 통해 그림을 그릴때 무제한의 크기의 도화지(?)를 얻은 것 같이 인프라를 운영할 수 있게 되었습니다.

Issues and Challenges

쿠버네티스 스터디

EKS 마이그레이션을 계획하고 제일 먼저 쿠버네티스에 대해서 스터디를 시작하였습니다.

EKS 및 KOPS 관련 스터디 내용은 아래 링크를 통해 확인할 수 있습니다.

[DOIK2] 데이터베이스 오퍼레이터를 이용하여 쿠버네티스 환경에서 배포/운영

[AEWS] AWS EKS 스터디

[PKOS] KOPS를 이용한 AWS에 쿠버네티스 배포

1년간의 지속적인 스터디를 통해 쿠버네티스의 필요성과 활용 가능성을 명확히 이해하게 되었습니다.

쿠버네티스 자격증 CKA,CKAD 취득

CKAD 자격증 취득 후기

CKA 자격증 취득 후기

DOIK2, AEWS, PKOS 등의 시리즈를 통해 깊이 있는 내용을 공부하고 실전 경험을 쌓음으로써, 쿠버네티스의 어려움을 극복할 수 있었습니다.

ECS to EKS Migration

24/7 운영되고 있는 서비스를 중단없이 마이그레이션하는 것은 항상 어려운 작업인 것 같습니다.

ECS 클러스터를 통합하면서 ALB 내부에서 가중치 기반으로 Target 그룹을 조정하여 배포하는것은 이번 마이그레이션에서 사용할 수 없었습니다.

새로 배포되는 EKS의 파드는 AWS-Loadbalancer-controller를 통해 관리하고자 하였으므로 기존의 ALB와는 분리하여 생성하였습니다.

이러한 챌린지를 성공적으로 완수하기 위해 Route53의 가중치 기반 라우팅 기능을 활용하여 ECS에서 EKS로 성공적으로 무중단 마이그레이션을 진행할 수 있었습니다.

Learning

구성원들의 성장에 대한 동기화

단순히 '나' 혼자만의 성장을 위한 노력이 아닌 '팀'의 성장을 위한 고민할 수 있게 시야를 넓힐 수 있는 계기가 되었습니다.

EKS 도입 시 가장 어려웠던 점으로 쿠버네티스의 높은 러닝 커브로 인해 팀 구성원들이 동시에 새로운 기술에 대해 이해하는 것이 힘들었습니다.

다양한 개념과 용어, 복잡한 아키텍처로 구성된 쿠버네티스는 초기에는 이를 이해하고 숙지하는 데에 시간이 많이 소요되었습니다. 이로 인해 팀원과의 기술적 협업과 소통에 어려움을 겪기도 하였습니다.

정말 감사하게도 각자 문제를 해결하기 위해서 아주 적극적으로 기술문서를 정리하여 서로 정리한 내용을 공유하고, 기술 세션을 통해서 Over-Communication에 가까울 정도로 서로 공유를 위해서 노력하였습니다.

이러한 노력으로 인해서 성공적으로 EKS 마이그레이션을 완수 할 수 있었습니다.

✅ CI/CD 파이프라인

CI/CD 파이프라인을 효율적으로 개선하고 확장함으로서 소프트웨어 전달 속도를 높이고 품질을 향상시키기 위해 프로젝트를 진행하였습니다.