Google SRE Culture - Module 1

SeungHyuk Shin·2023년 1월 10일
0

Google SRE Culture

목록 보기
1/2
post-thumbnail

서비스의 안정성이나 고객 이탈에 대해 고민해 본 적이 있을까?

개발 팀과 운영 팀 모두 "모든 것이 정상이다."라고 말한다 하지만 최종 사용자와 고객은 그렇지 않기 때문에 문제가 있을 것이다. 프로덕션 소프트웨어를 제작하고 실행하는 데 상당한 시간을 소비한 경우 사소한 업데이트를 배포할 때 고객에게 부정적인 영향을 미칠 수 있다는 불만을 느낀 적이 있을 것이다.

또한 중요한 기능을 위해 다음 릴리즈를 추진해야 하기 때문에 운영 팀이 주문한 프로덕션 프리즈가 정말로 사실에 근거한 것인지에 대해서도 의문을 제기했을 것이다. 이런 상황들이 익숙하게 느껴진다면,

개발 팀과 운영 팀이 우선 순위가 상충되는 경우가 많은 이유가 무엇인지, 그리고 왜 계속 사일로에서 작업하는지 궁금할 것이다. 구글은 수년간 대규모로 시스템을 운영해 왔다.

시간이 지남에 따라 팀과 고객 모두를 위해 기능의 속도와 안정성에 대한 위험의 균형을 맞추기 위해 관행을 표준화했다. 이러한 관행을 지원하는 문화와 결합하여 사이트 안정성 엔지니어링(SRE)이라고 한다.

클라우드로 전환하는 방법과 시기를 여전히 결정 중이거나 이미 클라우드 기술을 채택한 사용자라면 이 과정을 통해 실용적이고 문화적인 SRE 원칙이 IT와 IT에 지속적으로 긍정적인 영향을 미칠 수 있는 방법을 이해하는 데 도움이 될 수 있다. 변환 프로젝트 및 일상 업무. 또한 SRE에 대한 조직 규모와 성숙도 수준이 이러한 원칙의 구현에 어떤 영향을 미칠 수 있는지 알아본다.

이 과정은 SRE 기술 및 문화적 기초에 대한 개요를 제공하고 이를 조직에서 어디에 어떻게 적용할 수 있는지 설명한다.

SRE 원칙은 DevOps 철학 사례와 밀접하게 연계되어 있으므로 이 과정에서는 DevOps의 기본 사항도 다룬다. DevOps 관행에 이미 익숙하더라도 Google이 철학을 해석하는 방식을 듣게 될 것이다.

이 과정에는 몇 가지 전반적인 학습 목표가 있다. 이 과정을 마치면 DevOps 철학에 대한 Google의 관점과 DevOps와 SRE 간의 관계에 대해 논의하고 SRE가 IT 운영에 제공할 수 있는 가치를 이해할 수 있다. SRE에 대한 Google의 기술 및 문화적 기본 사항을 설명한다. SRE 채택에 있어 조직의 성숙도를 평가한다. 사이트 안정성 엔지니어에게 필요한 기술과 기존 인력을 교육하는 방법을 식별한다. 마지막으로 조직에서 SRE를 시작하는 데 Google이 어떤 도움을 줄 수 있는지 이해한다.

KEY POINT

  • 서비스에 대한 고객의 경험은 서비스가 얼마나 신뢰할 수 있는지.
  • 많은 IT 조직에서 개발 및 운영 팀과의 상충되는 우선순위.
  • 사이트 안정성 엔지니어링(SRE)은 안정성에 대한 위험이 있는 개발 기능의 속도.
  • SRE는 클라우드 또는 사내 기술 사용 여부에 관계없이 대규모 프로젝트와 일상 업무 모두에서 IT 팀에 이점을 제공할 수 있음

0개의 댓글