새소식

반응형
IT

RAID

  • -
728x90
반응형

 

 

안녕하세요 늑대양입니다 🐺

 

늑대양 by DALL-E

 

 

 

RAID와 관련해서 예전에도 개인적으로 정리를 진행했었지만..

머리에 기억이 잘 남지 않았던 경험이 있습니다..

 

최근에 RAID와 관련하여 이해하기 쉬운 영상을 시청하여,

해당 내용을 정리하여 블로그에 게시해도 좋을 것 같은 생각이 들어 업로드 합니다.

 

복잡하다고 느낄 수 있는 RAID에 대해, 이해를 도울 수 있는 게시글이기를 바랍니다.

 

 

 


RAID 6 (feat. ChatGPT)

RAID (Redundant Array of Independent Disks)는 여러 개의 하드 디스크를 하나로 묶어서 데이터의 안정성과 성능을 향상시키는 기술입니다. RAID는 여러 레벨이 있으며, 각 레벨은 다양한 방식으로 데이터를 분산, 복제, 또는 파티션화하여 저장합니다. 여기서 RAID 6에 대해 상세히 설명하겠습니다.

RAID 6는 여러 하드 디스크에 데이터를 분산하고 패리티 정보를 사용하여 데이터의 안정성을 높이는 레벨 중 하나입니다. RAID 6은 RAID 5와 유사하지만, RAID 6는 추가적인 패리티 정보를 저장하여 더 많은 디스크 장애를 허용할 수 있습니다.

RAID 6의 주요 특징은 다음과 같습니다:

  1. 이중 패리티 (Double Parity): RAID 6에서는 RAID 5와 달리 이중 패리티가 사용됩니다. 이중 패리티는 두 개의 독립적인 패리티 정보를 사용하여 데이터의 무결성을 보호합니다. 이는 두 개의 디스크 장애에 대비할 수 있도록 합니다.
  2. 여분의 디스크 공간 요구: 이중 패리티를 유지하기 위해 RAID 6은 RAID 5에 비해 더 많은 디스크 공간이 필요합니다. 일반적으로 최소 4개의 디스크가 필요하며, 그 이상의 디스크를 사용할 때 더 나은 안정성을 얻을 수 있습니다.
  3. 데이터 보호: RAID 6는 최소한 2개의 디스크 장애를 견딜 수 있습니다. 이는 하나의 디스크가 고장났을 때도 데이터 손실이 없도록 보장합니다. 또한 디스크 장애가 발생하면 이중 패리티를 사용하여 데이터를 복구할 수 있습니다.
  4. 성능: RAID 6의 쓰기 성능은 RAID 5에 비해 약간 저하될 수 있습니다. 이는 추가적인 패리티 정보를 계산하고 저장해야 하기 때문입니다. 그러나 일반적으로 RAID 6의 안정성은 이러한 성능 저하를 보장합니다.

요약하면, RAID 6은 두 개의 디스크 장애를 견딜 수 있는 높은 신뢰성을 제공하는데, 이는 비용이 더 많이 들 수 있고 쓰기 성능이 약간 저하될 수 있다는 점을 고려해야 합니다.

 

 


RAID

위키백과

  • Redundant Array of Independent Disks or Redundant Array of Inexpensive Disks
  • 복수 배열 독립 디스크
  • 여러 개의 하드 디스크에 일부 중복된 데이터를 나눠서 저장하는 기술

 

 

이해

  • 여러 개의 저장장치인 디스크를 하나로 묶어서 하나의 디스크처럼 사용하는 것
  • 왜 하나로 묶어야할까?
    • 과거에는 디스크의 저장용량이 크지 않았음
    • 가격도 비쌈
  • 디스크를 효율적으로 사용할 수 있는 방법이 없을까?
    • 저성능, 저용량 디스크를 고성능, 대용량 디스크 처럼 사용하고 싶음
    • 이러한 질문에 대한 대답이 RAID 에 대한 시발점
    • RAID의 I 가 Inexpensive 인 것도 이러한 논리
  • 디스크가 고장 났을 때를 대비하여 데이터를 보호하고 싶음
  • 시스템을 중단 없이 운영하고 싶다는 고민도 추가됨

 

 

가용성

  • Availability
  • 시스템이 장애 없이 정상적으로 운영되는 능력
  • 99%, 99.999% 처럼 9를 사용한 퍼센티지로 표현
  • 100%의 가용성을 제공하는 제품도 존재

가용성 관련 예시

 

 

  • 가용성이 특히 중요한 시스템도 있음 (ex. 금융, 군사 등)
  • 시스템에 사용되는 서버와 스토리지 같은 인프라는 보통 24시간 내내 중단없이 가동됨
  • 서버나 스토리지 안에 들어가는 하드디스크
    • 자성 물질을 입힌 원판(플래터)이 회전
    • 그 위에 헤드가 움직이면서 작동
    • 물리적 움직임이 있는 하드디스크는 내구성이 존재 → 사용하다보면 언젠가는 고장 발생 (a.k.a 디스크 깨짐)
    • 물리적 움직임이 없는 SSD → 내구성이 존재하여 무한히 사용할 수는 없음
  • 디스크의 장애는 시스템의 중단으로 이어질 수 있음 → RAID를 사용하여 가용성을 확보!

 

 


RAID의 종류

RAID 0

  • Striping
  • 데이터를 디스크에 분할하여 저장하는 방식
  • 데이터를 분할해야하기 때문에 디스크는 최소 두 개 이상 필요
  • 두 개의 디스크를 사용한다면 성능도 두 배가 됨 → 장점
    • 성능이 높아지는 이유:
      • 데이터 하나를 저장하는데 1 초가 소요된다고 가정
      • 디스크 하나를 사용하는 경우, 데이터 네 개를 저장하는데 4초 소요
      • 디스크 두 개를 사용하는 경우, 데이터 여덟 개를 저장하는데 4초 소요
    • 하지만 단점도 여기서 발생:
      • 디스크가 하나라도 고장 날 경우, 해당 디스크의 데이터를 모두 잃음 → 가용성이 나쁨
  • 데이터 ABCDEFGH
    • Disk 1: A, C, E, G
    • Disk 2: B, D, F, H
  • RAID 0 은 중요하지 않은 데이터를 저장할 때 사용
    • 안정성이 떨어져 권장하는 방식은 아님
  • 실제로 서버나 스토리지 환경에서 RAID 0 만을 사용하는 경우는 거의 없음

 

RAID 1

  • Mirroring
  • 데이터를 각각의 디스크에 중복하여 똑같이 저장하는 방식
    • 디스크를 여러 개 사용해도 디스크 한 개의 용량만큼만 사용할 수 있다는 의미
    • 복제하는 시간이 추가되어 저장하는 성능이 낮아짐
    • 읽는 속도는 모든 디스크에서 데이터를 볼러울 수 있어 빠를 수 있음
  • RAID 1 의 가장 큰 장점 → 가용성이 높다!
    • RAID 1 디스크 네 개를 사용하고 있는 경우, 세 개가 고장나도 문제없이 작동하고 데이터도 안전함
    • 가용성이 아주 좋음!
  • RAID 1의 단점
    • 용량낭비가 심함 → 모든 디스크에 똑같은 데이터가 들어감
    • 쓰기 속도가 느려짐
  • 데이터 ABCD
    • Disk 1: A, B, C, D
    • Disk 2: A, B, C, D

 

RAID 5

  • Striping with Parity
  • RAID 0 처럼 데이터를 분할하여 디스크에 저장
    • 그냥 분할 저장만 하는 것이 아니라 parity 를 함께 저장
    • Parity는 하나의 디스크에 저장되는 것은 아니고 매번 다른 디스크에 저장
  • Parity?
    • 정보의 전달 과정에서 오류가 생겼는지를 검사하기 위해 추가된 비트
    • 복구 정보 라고 이해하자!
    • 1의 개수가 짝수가 되도록 패리티 비트를 정하면 짝수 패리티
    • 1의 개수가 홀수가 되도록 하면 홀수 패리티
  • 데이터 ABCDEFGHIJKL
    • Disk 1: A, D, G, Parity
    • Disk 2: B, E, Parity, J
    • Disk 3: C, Parity, H, K
    • Disk 4: Parity, F, I, L
  • 짝수 패리티 사용을 가정
    • Disk 1: 0, 0, 0, Parity(=0)
    • Disk 2: 1, 0, Parity(=1), 0
    • Disk 3: 1, Parity(=0), 1, 0
    • Disk 4: Parity(=1), 1, 1, 1
  • Disk 3이 고장으로 데이터가 사라졌다고 가정
    • 패리티 비트를 짝수로 맞춘 것처럼 계산
    • 데이터도 다른 데이터로 가정
      • Disk 1: 0, 1, 1, 1
      • Disk 2: 0, 0, 0, 1
      • Disk 3: X, X, X, X → 0, 1, 1, 1 → 데이터 복구 가능!
      • Disk 4: 0, 0, 0, 1
  • 하지만 디스크 두 개가 고장나면 계산을 할 수 없으므로 복구 불가능
  • RAID 5는 디스크 한 개의 에러까지만 복구 가능
  • 최소 세 개의 디스크가 있어야 구성 가능
  • 가용성도 보통, 성능도 보통
    • 컨트롤러에 캐시를 달아 속도 저하를 최소화 하기도함
  • 용량의 경우, 디스크 개수에 따라 67~94% 까지 사용 가능
    • 비교적 용량 낭비가 적음

 

RAID 6

  • Striping with Double Parity
  • RAID 5와 비슷하지만 parity를 하나 더 추가하여 2차 parity 정보까지 저장
    • 안정성이 더 높아짐 → 두 개의 하드에 문제가 생겨도 복구 가능 → 가용성 좋음
  • 데이터 ABCDEFGH
    • Disk 1: A, C, Parity, Parity
    • Disk 2: B, Parity, Parity, G
    • Disk 3: Parity, Parity, E, H
    • Disk 4: Parity, D, F, Parity
  • 가용성 좋음
  • Parity 정보가 많아졌기 때문에 성능은 RAID 5보다 조금 낮아짐 → 성능 보통 수준
  • 용량은 디스크 개수에 따라 50~88% 까지 사용 가능 → 용량 낭비 낮은 편이지만 디스크를 네 개 사용하는 경우 전체 용량 대비 50% 까지만 사용 가능하여 낭비가 심한 편에 속함

 


Nested(중첩) RAID

  • 지금까지 살펴 본 표준 RAID를 다시 RAID로 묶어서 구현하는 방식
  • RAID의 장점을 섞어 가용성과 성능을 높일 수 있음

 

RAID 10

  • Mirroring + Striping
  • RAID 10 = RAID 1 + RAID 0
  • 미러링으로 복제하여 저장하는 RAID 1 방식 + 스트라이핑으로 분할하여 저장하는 방식의 RAID 0으로 묶어서 구성
  • RAID 1의 높은 가용성과 RAID 0의 높은 성능을 모두 사용 가능
  • 하지만 용량을 50% 사용한다는 것과 비용이 많이 든다는 단점 존재

 

RAID 50

  • Striping with Parity + Striping
  • RAID 5를 RAID 0으로 묶어 구성

 

RAID 60

  • Striping with Double Parity + Striping
  • RAID 6을 RAID 0으로 묶어 구성

 

RAID 한 눈에 보기

RAID 한 눈에 보기

 

 

 


Reference:

https://www.youtube.com/watch?v=SRDo7ZHe548

 

 

 

 

편안한 주말 보내셨기를 바랍니다.

긴 글 읽어주셔서 감사합니다 😍

 

 

 

728x90
반응형

'IT' 카테고리의 다른 글

[Linux] Linux 관련 기본 스터디 내용 정리 - 1  (0) 2023.04.12
Apache Airflow - 1. 개요  (1) 2022.11.21
2020년 최고의 프로그래밍 언어 10가지  (0) 2020.01.12
IT 카테고리  (0) 2019.08.05
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.