post-thumbnail

Google SRE Culture - Module 2

어떤 개발팀의 이야기 고객은 카탈로그를 검색하고 카트에 항목을 추가한 다음 구매를 완료한다. 이 온라인 소매업체의 운영 팀은 주요 측정 기준에 대한 리뷰를 매주 회의한다. 최근 리뷰에서 이 팀은 고객이 결제를 클릭하고 상태가 확인된 것으로 돌아올 때까지의 시간이 서서히 증가하고 있음을 발견했다. 이것이 중요한 문제가 아니라는 것을 인식하고 있지만, 해결될 필요가 있었다. 그 팀은 대기 시간 문제를 해결하기 위해 조용히 시간을 보냈다. 시간이 지남에 따라 비즈니스 측면에서 제품 개발 팀은 기능을 계속 강화했다. 개발자들은 새로운 기능을 제공하는 비즈니스 요청을 따라잡기 위해 시간이 지남에 따라 작업을 시작했을 뿐만 아니라 앞서 확인된 작은 지연 시간 버그를 해결하기 위해 노력했다. 제품 팀들은 여전히 개발 속도에 만족하지 않았다. 기본적으로 IT 팀은 비즈니스를 만족시키기 위해 노력을 기울였다. 이들은 비즈니스와 신뢰성 모두의 요구를 충족시키기 위해 어려움을 겪고 있다.

2023년 1월 12일
·
0개의 댓글
·
post-thumbnail

Google SRE Culture - Module 1

서비스의 안정성이나 고객 이탈에 대해 고민해 본 적이 있을까? 개발 팀과 운영 팀 모두 "모든 것이 정상이다."라고 말한다 하지만 최종 사용자와 고객은 그렇지 않기 때문에 문제가 있을 것이다. 프로덕션 소프트웨어를 제작하고 실행하는 데 상당한 시간을 소비한 경우 사소한 업데이트를 배포할 때 고객에게 부정적인 영향을 미칠 수 있다는 불만을 느낀 적이 있을 것이다. 또한 중요한 기능을 위해 다음 릴리즈를 추진해야 하기 때문에 운영 팀이 주문한 프로덕션 프리즈가 정말로 사실에 근거한 것인지에 대해서도 의문을 제기했을 것이다. 이런 상황들이 익숙하게 느껴진다면, 개발 팀과 운영 팀이 우선 순위가 상충되는 경우가 많은 이유가 무엇인지, 그리고 왜 계속 사일로에서 작업하는지 궁금할 것이다. 구글은 수년간 대규모로 시스템을 운영해 왔다. 시간이 지남에 따라 팀과 고객 모두를 위해 기능의 속도와 안정성에 대한 위험의 균형을 맞추기 위해 관행을 표준화했다. 이러한 관행을 지원하는 문화와

2023년 1월 10일
·
0개의 댓글
·
post-thumbnail

GCP로 CI/CD 구축 후기

AWS RDS와 EC2만 사용해보다가 GCP 3개월 300달러 쿠폰을 사용해서 GCP를 사용해보았다. 원래도 AWS에서 사용하듯이 IaaS인 Compute Engine을 띄워서 구동해보려 했으나, 조금 더 도전해보고 싶어서 GCP에서 지원하는 PaaS를 사용해서 CI/CD를 구축했다. 이번 글에서는 GCP를 사용하면서 겪었던 트러블에 대해 작성해보려 한다. 사용한 스택 : Cloud SQL, Compute Engine, Cloud Build, App Engine, Cloud Run >치열한 나와 GCP의 투쟁 Cloud SQL 첫 시작은 Cloud SQL을 적용하고 나서의 이야기다. 로컬에서 실행할때는 jdbc의 url을 직접 적어 아이디와 패스워드로 인증을 했는데, Clo

2022년 4월 30일
·
0개의 댓글
·