10/13(목) 클라우드1

Yuri JI·2022년 10월 13일
0

Kakao Cloud School

목록 보기
19/27
post-thumbnail

✍ aws

상암에서 300GB를 인터넷망으로 다른 곳에 옮길거야 -> 1시간 ~ 1시간 30분정도 걸린다.
근데 aws의 direct connect를 쓰면 300GB가 10분에 끝난다.

💭 Amazon S3 버킷에 최대한 빨리 집계하려고합니다. 솔루션은 운영 복잡성을 최소화해야 합니다.
어떤 솔루션이 이러한 요구사항을 충족합니까?
: S3 Transfer Acceleration

SAA-C03 자격증
Route 53 = DNS

✍ 개요 !

키워드 중심으로 공부하고 오기

  • Networking

    • VPC를 만드는 것이 시작입니다.
    • NACL (network ACL이라고 읽는다.)
    • CIDR
    • subnet, security groups
    • NAT Gateway
    • 권고사항 : app server, db server는 private에, web server는 public에..
      • 근데 요즘에는 web 서버도 private에 두려한다. -> NAT Gateway 필요하다.
    • NAT가 고가용성에 어떤 영향을 미치니
    • CDN(Content Delivery Network) : 전송속도 향상. 지연 시간이 발생 하지 않는다. 왜 ? 캐시를 서울이 아닌 호주나 영국 등 가까운 곳에서 받을 수 있기때문에
    • ELB (Elastic LB)을 갖고있다.
      • ALB (L7)
      • NLB (L4)
      • 🤔 HAProxy -> L4 L7 둘 다 다룰 수 있음
  • 3-Tier

    • fe - be -db
    • web - app - db
    • web - was - db
  • Database

    • S3 : Object Storage
    • EBS : Elastic Block Store (Disk-HDD,SSD)
      • SSD는 빠른 IO가 필요할 때
  • EFS : Elastic File System

  • S3 Glacier : 주로 백업용, 보관용 데이터를 저렴하게 저장

    • IOPS - MBPS
    • 어떤 경우에 뭐 쓰는지
    • IOPS = I/O Per Second
    • MBPS = MB per second : Database에 중요
  • S3 스토리지에 lifecycle 정책을 다르다

    • S3 standard, S3의 종류가 5개나 돼
    • 왜? 비용 차이 ! !
    • 오늘 들어온 데이터가 일주일 뒤에는 access 빈도가 줄어, 한 달 지나면 더 줄어
    • 그러면 비용을 생각해서 lifecycle 정책을 바꿔서 다른 S3 스토리지에 저장한다.
    • 결론~ 비용절감 차원에서 lifecycle 정책이 필요하다.
      • static website hosting: 정적 웹 호스팅
    • versioning: rollout undo.... deploy에서 revision...
    • Pre-signed URL : 보안관련 기능
    • CORS: 권한 정책 관련
    • Glacier: Archival storage
    • on-premise 서버 데이터를 클라우드 쪽에 주기적으로 보내야한다면 Storage gateway를 이용하면 된다.
  • Compute

    • EC2

    • Auto Scaling

    • Instance Type

      • On-demand: 사용한만큼 돈 내
      • Spot: 잘 사용하면 가격이 아주 저렴, 90%정도까지 비용 절감 가능 -> Solution Architecher가 담당한다. 비용, 성능 절감..
      • Reserved:
    • Reservce purchase : 예약 인스턴스도 잘 쓰면 72%까지 비용 절감 가능

      • Scheduled: 회사의 워크로드 패턴을 분석해서 차트로 그린 후에 어떤 시간에 많이 쓰이고 적게 쓰이는지 분석해서 그 시간대에 적절한 인스턴스를 배치한다.
    • Lambda : serverless architecture.

      • 서버 구성도 귀찮다 !
      • serverless는 개발 지식이 많아야 한다.
      • serverless면 ip 주소도 없는건데 어떻게 서버랑 DB랑 연결? => API 통신
        • API 통신
          • Application Programing Interface
          • 예를 들어 이런 사례에서 씁니다.
          • 🤔🤔뭐라 말해야되지 사례를
    • Beanstalk: 잭과 콩나무

      • beanstalk을 통해서 서버를 빠르게 구축할 수 있음 -> 벌레나와서 잘 못 들음
  • Database

    • 관계형 vs 비관계형
      • 스키마가 있냐 없냐 일정한 패턴이 있냐 없냐
    • Aurora : across AZs (최대 6개까지 가용역을 걸칠 수 있다.) : 클러스터 만들 때 사용
    • Automated Backup -> AWS Backup 서비스 이용할 수 있음
    • opensearch (ElasticSearch).. 프로메테우스.. 엘라스틱서치..
  • Analytics

    • Kinesis 실시간 스트리밍 데이터 작업
    • Amazon Rekognition : 이미지 검색 및 분석
    • RedShift : 빠르고 간단하며 비용 효과적인 데이터 웨어하우징

    💭 OLAP = DW = DSS = Datamart(소규모)
    💭 OLTP = oracle

    • 분석하면 시각화를 통해 가시성을 확보해야한다. 왜? 예측을 위해서, business intelligence tool
      • QuickSight: 시각화 도구
    • AWS Glue : Hadoop(분산 클러스터 시스템)-> aws에서는 EMR, 하튼 하둡을 시각화하는 도구
  • Security

    • 보안의 가장 기본
      • AuthN 인증 AuthZ 인가 !
      • IAM (리소스에 대한 액세스 관리 = 권한관리)
    • SQS : Simple Queue Service
      • 과도한 요청이 들어오면 대기열에 쌓아놨다가 차근차근 뿌린다. (요청을 놓치지 않도록 !)
    • RTO / RPO
      • RTO 목표 복구 시간: Recovery Time Objective
      • RPO 목표 복구 시점 : Recovery Point Objective
  • cloudwatch

    • aws 모든 서비스의 로그를 볼 수 있음
    • 장애 원인 분석 가능
  • Integration Tools

    • pub/sub : publish subcribe 게시 구독
  • cloudFront : CDN service


  • 클라우드 컴퓨팅 개론

  • 클라우드 컴퓨팅

  • : 용량 추정 불필요 (프로비저닝 수준에서는 요구됨)

  • 장점

    • 제품 출시 속도
    • 리소스 최적화
    • 운영 효율성
  • 클러스터에서 많이 쓰는 단어

    • Elastic, Agile(민첩한)
  • WAF(Well Architect Framework)

    • 평가기준
    • 비용최적화, 성능효율성, 안정성, 보안, 운영 우수성
    • 5가지를 모두 챙기기는 어렵다.. 그래서 기준 요소를 정하자...
  • Global Infrastructure

    • Region : 가용영역을 묶는 도시 단위의 표현
    • 가용영역
      • 데이터 센터의 논리적인 표현
    • 엣지 로케이션


메모장

⭐ 📘 📗 💭 🤔 📕 📔 🐳 ✍ 🥳 ⭐ 🐣 👻

  • vpn: 회사 내
    -> vpc: virtual private cloud

  • 사설 네트워크 IP는 이걸로 쓰자 (IETF RFC 1918)
    172.x, 192.x, 10.x

NAS fire Server = NFS... 아 이거 파일시스템이구나 알아야한다.

DB는 꼭 back up을 해야되는데 (for 장애대비)
왜 Tape Backup 써?
tape(Sequential AM) vs disk(Direct Access Method)
tape이 disk(HDD,SSD)보다 안전...
tape 백업은 진짜 어쩌다 한 번 쓸까말까... 그래서 싼 거 씀
SAM: 5번 가고싶으면 1->2->3->4->5
DAM: 5번 가고싶으면 바로 가.

migration(이전) lift & shift

  • router vs switch(스위치가 더 비쌈)
    • 🤔 왜 더 비싼 이유가 있을 거 아니냐

      • 스위치는 불명확한 목적지를 가진 데이터를 처리할 때 모든 포트로 데이터를 퍼뜨리는 브로드캐스트를 하지만 라우터는 해당 데이터를 버린다.
        혹시 이건가
        스위치는 관리자의 설정이 필요 없지만 라우터는 관리자의 설정으로 라우팅 테이블 생성과 통신을 해야한다.

      => 스위치는 나한테서 나간 애라는걸 안다.
      이 기능이 왜 필요한지 ? ! 🤔

LB 두 대 두었음 이거 설명해달라고하자.......

Security Group(SG), Network ACL(NACL)

  • NAT가 고가용성에 어떤 영향을 미치니

  • 어제 조별 발표에서 대답 못 한 것

    • IOPS(워크로드가 초당 8만건씩들어온다.
    • 어떻게 커버할래 -> EBS 프로비저닝된 IOPS SSD

    bigdata3V - 볼륨, 다양성, 빠른

  • cache의 대표

    • redis, memcached
    • in-memoryDB인데 cache용도로 쓴다...
    • 구독 서비스에 좋은게 redis -> 나중에 배우래요
  • cache vs memory vs buffer 차이는?

  • (on premise | 사설클라우드) + public => hybrid cloud

  • multi cloud = 각 클라우드 서비스의 장점만 사용

  • Lift-and-shift

    • 우리 회사는 지금 이렇게 쓰고있는데요~
    • 어떻게 옮겨주세요 ~
    • 7Rs 중에 rehosting 단계
  • 7Rs (🤔이게뭐죵)

  • DB 앞에 cache 두는 이유(ex.Memcache)
    disk IO 속도 향상 시키기 위해서
    사용자가 한 번이라도 요청한 데이터는 cache에 두어서 읽기 속도를 빠르게 한다.

  • NAT Gateway의 역할

  • fail over <-> switch over (계획을 세워서 중지 시키는 것)


프로젝트에 master standby.. 둬라

cloud watch: CDN: 전세계에 있는 aws cache 서버(엣지 로케이션)을 이용.

서버의 주기는 5년입니당

profile
안녕하세요 😄

0개의 댓글