시리즈

devops

1.[DevOps] 1. 서버 상태 체크 (스크립트)

서비스 중인 서버들의 상태를 매일 체크하기 - 주요 명령어 sar System Activity Report의 약자 CPU, 메모리, 소켓, I/O 등의 여러 정보 확인 가능 uname Unix Name의 약자, 시스템 및 커널 정보 확인 -r ( --k

2025년 7월 8일

2.[DevOps] 2. 파일 배포 (스크립트)

동일한 명령어를 여러번 입력하지 않고, 스크립트 하나로 해결하자json (Javascript Object Notation)구조화된 데이터를 간결하게 표현가능한 방식jq (json query)툴, CLI 유틸리티tr (translate or delete) -d (--de

2025년 7월 8일

3.[DevOps] 3. 데이터 백업 (스크립트)

이제부터 날짜별로 백업하자

2025년 7월 9일

4.[DevOps] 4. 로그 파일 분석 (스크립트)

| awk(Aho + Weinberger + Kemighan)awk의 기본 기능은 텍스트 형태로 되어 있는 입력 데이터를 행과 단어 별로 처리해 출력하는 것

2025년 7월 9일

5.[DevOps] 5. 사용자 관리 (스크립트)

| IFSinternal Field Separator문자열을 나눌 때 기준이 되는 문자를 정의하는 환경 변수echo $IFS 하면 default 값인 공백이 보이고, 이를 수정하는 것도 가능| Here Document 방식bash <<< " 요딴 방식

2025년 7월 9일

6.[DevOps] 6. 네트워크 트래픽 (스크립트)

| seq순차적으로 프린트seq 254: 1 ~ 254seq 100 200: 100 ~ 200| tee표준에서 읽어서 표준 출력도 하지만, 파일에도 쓰게끔 하는 명령어 (-a : --append)| ping\-c1 (count 1번)\-w1 (deadlint 1초)

2025년 7월 9일

7.[DevOps] 애플리케이션 로그 관리

pod에 문제가 생겨 지금 즉시 로그를 확인해야할 것같다.어떻게 바로 확인할 수 있을까?컨테이너화 된 애플리케이션의 stdout(표준출력) 및 stderr(표준 에러) 스트림에 의해 생성된 모든 출력은 컨테이너 런타임이 처리다양한 컨테이너 런타임들은 이를 각자 다른 방

2025년 7월 14일

8.[DevOps] 로그 레벨 관리

로그를 확인했는데, 너무 많아서 간단히 보고싶다.간단히 나올 수 있도록 설정하자.

2025년 7월 14일

9.[DevOps] 장애지표 설계 및 관리 모형

서비스 운영 경험이 있다면 무조건 겪어볼 수 밖에 없는 것은 바로 장애. 모든 서빗는 코드, 시스템, 인프라, 외부 요인 등으로 장애가 발생한다.장애가 발생하면 빠르게 대응하는 것이 가장 중요하다. 장애가 발생했을 때 얼마나 잘 대응하고 있는지, 그리고 장애 대응 능

2025년 7월 14일

10.[DevOps] 심각도와 영향 분석. 우선순위와 긴급도, 심각도의 차이

장애의 심각도 수준을 파악하고 서비스 전반에 어떤 영향을 주고 있는지 파악하는 것이 가장 중요하다.이는 사고의 경중을 판단하고 고객 영향을 최소화하거나 완화할 전략이 수립될 수 있기 때문이다.사용자 기준에서 심각한 정도비즈니스 기준에서 중요한 정도

2025년 7월 14일

11.[DevOps] 장애 보고서 템플릿

장애보고서(COE)에 들어가야할 것.

2025년 7월 14일