서비스 중인 서버들의 상태를 매일 체크하기 - 주요 명령어 sar System Activity Report의 약자 CPU, 메모리, 소켓, I/O 등의 여러 정보 확인 가능 uname Unix Name의 약자, 시스템 및 커널 정보 확인 -r ( --k
동일한 명령어를 여러번 입력하지 않고, 스크립트 하나로 해결하자json (Javascript Object Notation)구조화된 데이터를 간결하게 표현가능한 방식jq (json query)툴, CLI 유틸리티tr (translate or delete) -d (--de
이제부터 날짜별로 백업하자
| awk(Aho + Weinberger + Kemighan)awk의 기본 기능은 텍스트 형태로 되어 있는 입력 데이터를 행과 단어 별로 처리해 출력하는 것
| IFSinternal Field Separator문자열을 나눌 때 기준이 되는 문자를 정의하는 환경 변수echo $IFS 하면 default 값인 공백이 보이고, 이를 수정하는 것도 가능| Here Document 방식bash <<< " 요딴 방식
| seq순차적으로 프린트seq 254: 1 ~ 254seq 100 200: 100 ~ 200| tee표준에서 읽어서 표준 출력도 하지만, 파일에도 쓰게끔 하는 명령어 (-a : --append)| ping\-c1 (count 1번)\-w1 (deadlint 1초)
pod에 문제가 생겨 지금 즉시 로그를 확인해야할 것같다.어떻게 바로 확인할 수 있을까?컨테이너화 된 애플리케이션의 stdout(표준출력) 및 stderr(표준 에러) 스트림에 의해 생성된 모든 출력은 컨테이너 런타임이 처리다양한 컨테이너 런타임들은 이를 각자 다른 방
로그를 확인했는데, 너무 많아서 간단히 보고싶다.간단히 나올 수 있도록 설정하자.
서비스 운영 경험이 있다면 무조건 겪어볼 수 밖에 없는 것은 바로 장애. 모든 서빗는 코드, 시스템, 인프라, 외부 요인 등으로 장애가 발생한다.장애가 발생하면 빠르게 대응하는 것이 가장 중요하다. 장애가 발생했을 때 얼마나 잘 대응하고 있는지, 그리고 장애 대응 능
장애의 심각도 수준을 파악하고 서비스 전반에 어떤 영향을 주고 있는지 파악하는 것이 가장 중요하다.이는 사고의 경중을 판단하고 고객 영향을 최소화하거나 완화할 전략이 수립될 수 있기 때문이다.사용자 기준에서 심각한 정도비즈니스 기준에서 중요한 정도
장애보고서(COE)에 들어가야할 것.