profile
기록하고 공유하려고 노력하는 DevOps 엔지니어
post-thumbnail

KubeVirt + Apache Guacamole로 구축하는 통합 인프라 접속 포털

Kubernetes 위에서 가상머신을 운영하고, 웹 브라우저 하나로 모든 인프라에 접속하는 플랫폼을 구축한 이야기IDC에 7대의 물리 서버, 그 위에 Kubernetes 클러스터, 그리고 KubeVirt로 운영하는 가상머신들. 인프라가 커질수록 접속 관리는 복잡해집니다

2일 전
·
0개의 댓글
·
post-thumbnail

On-Premise Kubernetes 인프라 구축기: 7노드 HA 클러스터에서 Production-Grade 플랫폼까지

IDC 환경에서 Bare-Metal Kubernetes 클러스터를 구축하고, GitOps 기반의 완전 자동화된 인프라를 설계한 과정을 공유합니다.클라우드 환경이 대세인 시대에 굳이 On-Premise를 선택한 이유가 있습니다. GPU 워크로드(RTX 3090, Tita

2일 전
·
0개의 댓글
·

Day 9: Istio Service Mesh 소개와 첫걸음

마이크로서비스의 한계와 Service Mesh의 필요성(2. Istio란 무엇인가(3. Istio 아키텍처 깊이 이해하기(4. 실습: Istio 환경 구축(5. Gateway와 VirtualService 완벽 이해(6. 트래픽 흐름 완전 분석(7. Istio의 강력한

2025년 11월 9일
·
0개의 댓글
·

Kubernetes 정복기: Helm + ArgoCD로 GitOps 파이프라인 구축 (Day 8)

2025년 11월 8일수동 배포는 이제 그만! Git Push 한 번으로 자동 배포되는 마법Day 7에서 Ceph 분산 스토리지로 진정한 동적 프로비저닝을 경험했습니다. 이제 Day 8에서는 GitOps 패러다임의 핵심 도구인 Helm과 ArgoCD를 마스터하여 선언적

2025년 11월 9일
·
0개의 댓글
·

Kubernetes 정복기: Ceph 분산 스토리지로 진정한 동적 프로비저닝 구현 (Day 7)

2025년 11월 7일단일 노드 한계를 넘어! RBD/CephFS/RGW 세 가지 스토리지를 모두 구축하다Day 6에서 Prometheus + Grafana로 모니터링, Vector + OpenSearch로 로그 중앙화를 마스터했습니다. 이제 Day 7에서는 Kuber

2025년 11월 6일
·
0개의 댓글
·
post-thumbnail

Kubernetes 정복기: Monitoring & Logging으로 클러스터 가시성 확보 (Day 6)

2025년 11월 4일Prometheus + Grafana로 메트릭 수집, Vector + OpenSearch로 로그 중앙화, Custom Metrics까지!Day 5에서 Production 환경 운영을 위한 Job/CronJob, Network Policy, Helm

2025년 11월 4일
·
0개의 댓글
·

Kubernetes 정복기: Production-Ready 운영 완벽 정복 (Day 5)

2025년 11월 3일Job/CronJob, Network Policy, Resource Quotas, CRD, Helm Chart, etcd Backup, Cluster Upgrade까지!Day 4에서 Ingress, HPA, RBAC, StatefulSet, Dae

2025년 11월 3일
·
0개의 댓글
·

Kubernetes 정복기: Advanced 패턴 마스터하기 (Day 4)

2025년 11월 3일Ingress, HPA, RBAC, StatefulSet, DaemonSet, Monitoring까지 완벽 정복!Day 3에서 Secret, Rolling Update, PV/PVC, Resource Limits, Health Check 등 운영에

2025년 11월 2일
·
0개의 댓글
·

Kubernetes 정복기: 운영 필수 기술 마스터하기 (Day 3)

3-node 클러스터에서 직접 실습하며 배운 Kubernetes Operations의 모든 것Day 2에서 클러스터 아키텍처와 네트워킹을 이해했다면, Day 3는 실전 운영에 필요한 기술들을 익히는 날이었습니다. Secret 관리부터 Rolling Update, Hea

2025년 11월 1일
·
0개의 댓글
·

Kubernetes 정복기: 네트워킹 심화와 첫 애플리케이션 배포 (Day 2)

3노드 클러스터 환경에서 Control Plane부터 실제 애플리케이션 배포까지Day 1에서 클러스터의 기본 구조를 이해했다면, Day 2는 실전이었습니다. Control Plane이 어떻게 동작하는지, Pod 간 통신이 실제로 어떻게 이루어지는지, 그리고 마침내 외부

2025년 10월 30일
·
0개의 댓글
·

Kubernetes 정복기: 3노드 클러스터로 시작하는 첫걸음 (Day 1)

안녕하세요! 저는 최근 온프레미스 환경에서 Kubernetes 클러스터를 직접 구축하고 운영하면서 많은 것을 배우고 있습니다. 오늘은 그 여정의 첫 번째 날, "클러스터 기초와 아키텍처 이해"에 대해 이야기해보려 합니다.처음 Kubernetes를 접할 때 가장 막막했던

2025년 10월 29일
·
0개의 댓글
·

Ubuntu 네트워크 관리 완벽 이해: NetworkManager, systemd-networkd, 그리고 Netplan의 관계

Ubuntu에서 네트워크 설정을 변경하다가 예상치 못한 문제를 겪어본 경험이 있으신가요? 저는 최근 Ubuntu Desktop에서 Kubernetes 클러스터를 구성하면서 DNS 설정이 적용되지 않는 문제로 몇 시간을 씨름했습니다. 이 과정에서 Ubuntu의 네트워크

2025년 10월 28일
·
0개의 댓글
·

Kubernetes BGP 완벽 가이드: 언제, 왜, 어떻게?

🤔 "클러스터 내부는 CNI가 알아서 하는데, BGP는 왜 필요하죠?" Kubernetes CNI와 BGP의 경계를 명확히 이해하고, 실전에서 BGP가 필요한 순간을 알아봅시다.BGP란 무엇인가?(2. CNI vs BGP: 역할 구분(3. BGP가 필요한 순간(4.

2025년 10월 27일
·
0개의 댓글
·

Kubernetes CNI 완벽 가이드: Calico vs Flannel 실전 비교

Calico와 Flannel, 어떤 CNI를 선택해야 할까? eBPF와 BGP가 뭐길래 성능이 3배나 빨라진다는 걸까? 실전 사용 사례를 통해 완벽하게 이해해보자.CNI란 무엇인가?(2. Calico vs Flannel 핵심 비교(3. eBPF 완전 정복(4. BGP

2025년 10월 27일
·
0개의 댓글
·
post-thumbnail

AWS ALB vs NLB

AWS에서 로드밸런서를 선택할 때 ALB(Application Load Balancer)와 NLB(Network Load Balancer) 중 어떤 것을 선택해야 할까요? 단순히 L7과 L4의 차이로만 이해하고 있다면, 실제 운영에서 예상치 못한 문제를 만날 수 있습니

2025년 9월 23일
·
0개의 댓글
·
post-thumbnail

Terraform과 Terragrunt 기반 인프라 관리 아키텍처

단일 Terraform 모듈과 Terragrunt를 활용하여 Stage/Production 환경을 동일한 코드로 관리하며, GitHub Actions 기반 GitOps 파이프라인으로 인프라 배포 시간을 80% 단축하고 환경 간 불일치로 인한 장애를 Zero로 만든 프로

2025년 9월 19일
·
0개의 댓글
·
post-thumbnail

Harbor 컨테이너 레지스트리 플랫폼 구축 및 마이그레이션

기존 Docker Registry에서 엔터프라이즈급 Harbor 플랫폼으로 전환하며, Harbor의 내장 Registry 기능을 활용한 자동 마이그레이션과 재해복구 체계를 구축한 프로젝트입니다. 7개 팀, 30명의 사용자가 사용하는 AI/ML 플랫폼의 컨테이너 레지스트

2025년 9월 19일
·
0개의 댓글
·
post-thumbnail

오프라인 환경을 위한 Kubernetes 기반 고가용성 AI/ML 추론 플랫폼 구축

오프라인 환경에서 운영되는 엔터프라이즈급 AI/ML 추론 플랫폼을 구축한 프로젝트입니다. GPU 가속 추론, 3중화 클러스터링, 분산 스토리지, 그리고 완전한 오프라인 운영을 지원하는 마이크로서비스 아키텍처를 설계하고 구현했습니다.100% 오프라인 운영 가능한 AI/M

2025년 9월 19일
·
0개의 댓글
·

Terraform에서 Terragrunt로: DRY 원칙을 통한 인프라 코드 혁신

현대 클라우드 환경에서 인프라를 코드로 관리하는 것은 필수가 되었습니다. Terraform은 이러한 흐름을 선도하는 도구이지만, 복잡한 멀티 환경 구성에서는 여러 한계에 부딪히게 됩니다. 이 글에서는 Terraform에서 발생하는 코드 중복 문제를 해결하기 위해 Ter

2025년 5월 19일
·
0개의 댓글
·
post-thumbnail

마이크로서비스 기반 로그 및 트레이스 분석 시스템 개발기

안녕하세요! 오늘은 최근에 완성한 마이크로서비스 기반 로그 및 트레이스 분석 시스템의 개발 과정과 아키텍처에 대해 공유하려고 합니다. 특히 Model Context Protocol(MCP)을 활용한 접근 방식이 어떻게 효율적인 모니터링 솔루션으로 이어졌는지 설명드리겠습

2025년 5월 2일
·
0개의 댓글
·