운영체제

저장장치

RAID

Redundant Array of Inexpensive Disks

왜 필요한가?

  • 서버 or 스토리지 등 장비는 항상 손상될 수 있다.
    • 천재지변, 장비 노후 등 다양한 원인이 있을 수 있음.
  • 장비가 손상된다면 그 안의 데이터도 유실될 것이고, 이를 방지할 필요가 있다.
  • 이렇게 데이터를 분산 저장하는 방법을 RAID라고 하고 크게 Mirroring(복제), Striping(무작위 저장)으로 나뉜다.

RAID 0 (Stripe)

2개 이상의 디스크에 데이터를 무작위로 write

  • 장점 : 데이터 사용시 디스크 갯수만큼 I/O가 분할되기 때문에 I/O 속도가 향상된다.
  • 단점 : 디스크 중 하나라도 장애가 발생하면 복구가 어렵다.
    • 위 사진에서 DRIVE 2가 손상되면 Block 2, 4, 6, 8은 복구가 어렵다. 디스크가 1개만 문제를 일으키더라도, 전체 데이터에 영향을 줄 수 있다.
    • 예를 들어 we are the world라는 문장을 저장한다고 했을 때
      • we, the → DRIVE 1
      • are, world → DRIVE 2
    • 와 같은 형태로 저장한다면, DRIVE 2에 문제가 생기면 전체 문장에서 we, the만 남게 되기 때문에 전체 데이터에 영향을 주게 된다.

RAID 1 (Mirror)

적어도 2개 이상의 디스크에 동일한 데이터를 중복 write

  • 장점 :
    • 디스크 n개가 동시에 오류를 일으키지 않는 이상 복구도 쉽고 가용성도 높다.
  • 단점 :
    • 100mb 데이터를 저장하기 위해서는 100mb * n의 디스크가 필요하다.

RAID 2 (Stripe)

Stripe 방식으로 데이터를 작성하는 기록용 디스크와 에러 교정 코드 (해밍 코드) 디스크를 따로 운영.

  • 해밍 코드를 저장하는 디스크를 별도로 운영하는 것이 특징

    • 에러 여부를 확인만 할 수 있는 패리티 비트
    • 에러 여부를 확인하고 동시에 교정까지 가능한 해밍 코드
  • 단점 :

    • 해밍 코드 저장을 위해 n-1개의 디스크가 추가로 필요로 함
    • 오류 교정을 계산하는데 많은 시간이 소비되어 요즘에는 잘 사용되지 않는 방식

RAID 3, RAID 4 (Stripe)

별도의 디스크에 패리티 비트를 저장한다는 방식은 RAID 2와 비슷하지만 디스크 양이 줄어든 형태

3은 데이터를 바이트 단위로, 4는 데이터를 블록 단위로 나눠서 분산 저장

패리티 비트는 오류 검출은 가능하지만 교정 기능은 없다. 그러나 RAID에서는 N-Way 패리티 비트 방식을 사용해 오류를 복구할 수 있다(N-way 패리티비트 방식은 정확히 뭔지 잘 모르겠다).

  • 장점 :

    • 디스크 공간을 온전히 다 사용할 수 있고(Stripe), 에러 체크 및 수정을 위한 패리티 비트를 별도로 저장하지만 디스크 4개당 1개 정도의 디스크만 필요하기 때문에 디스크 사용량으로 봤을 때는 효율적
  • 단점:

    • 여전히 패리티 디스크가 망가지면 복구가 어렵다.
    • 패리티 디스크가 특정 디스크에 집중되기 때문에 장애 시 복구는 더 어려워지고 데이터 입출력이 일어날때마다 패리티 디스크에서 병목 현상이 발생할 수 있다.

RAID 5 (Stripe)

패리티 정보 자체를 stripe로 구성된 디스크 내에서 갖고 처리하도록 하는 방식

보면, 데이터 A가 없는 디스크에 A의 패리티 비트가 저장되어 있다. 다른 데이터들도 마찬가지로 해당 데이터가 없는 디스크에 해당 데이터의 패리티 비트가 저장되어 있는 것을 볼 수 있다.

  • 장점 :

    • 디스크가 손상되더라도 다른 디스크들로부터 복구가 가능하다.
    • 이전의 방식들보다는 뭔가 획기적인 느낌
  • 단점 :

    • 굳이 꼽자면, n개의 디스크가 동시에 망가지면 이것도 좀 골치가 아프다
      • ex) A 데이터가 포함되어 있는 디스크 1개와 A의 패리티 비트가 포함되어 있는 디스크가 동시에 고장나면..

RAID 6 (Stripe)

RAID 5에서 2차 패리티 비트를 추가로 분산 저장한 형태

패리티 비트를 2개로 구성해 디스크에 저장한다.

  • 장점 :
    • RAID 5보다 안정성이 높아진다.
  • 단점:
    • RAID 5보다 디스크 사용량이 좀 더 많아지고 계산량이 많아진다.

이전에 패캠 챌린지를 해본적은 없지만 이번 패캠 챌린지는 진짜진짜 귀찮다..
주말도 없이 매일 강의하나듣고 글쓰는것도 오바고, 그리고 공부한 사진은 왜올려야하는건데.. 인강 강의들은 기록보면 공부한거알잖아 사진이 왜필요함..하... 개귀찮 ㅡㅡ 금욜마다 내가 글쓴 주소를 다시 알려줘야함.. 그럴거면 처음에 블로그 주소는 왜받은거람.. 이렇게 귀찮다니.. 반절도 안지났는데 힘들어~~ 이렇게 힘들게 했는데 환급챌린지 실패했다고 하면 진짜 진짜 슬플듯.... ㅜㅜ 흑
회사+영어학원+자격증공부+패캠챌린지 너무 오바였나봄.. 하하 괜히 글써야한다는 압박감때문에 제대로 강의 듣지도못하고 ㅠ,,

https://bit.ly/3FVdhDa
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.

profile
Devops, AWS에 관심있어요.

0개의 댓글