[Storage] 정보 스토리지와 관리
# 정보 스토리지와 관리
1. RAID
1-1. RAID 레벨
1-1-1. RAID 0
- 데이터가 RAID 집합의 모든 디스크에 데이터를 스트라이핑하는구성
- RAID 집합의 모든 디스크 공간 사용
- 높은 I/O 처리량이 필요한 애플리케이션에 적합
1-1-2. RAID 1
- 미러링 기술 사용
- 장애 복구 기능 제공
- 2개의 디스크 드라이브로 구성
- 모든 쓰기는 두 디스크에 모두 기록
- 높은 고가용성이 요구되며 비용 제한이 없는 경우에 적합
1-1-3. RAID 1+0
- 스트라이핑된 미러
- 미러 쌍으로 데이터가 먼저 미러링된 후 RAID 집합의 디스크 드라이브 쌍에 데이터 사본이 스트라이핑
- 작은 I/O, 랜덤 I/O, 쓰기가 많은 I/O 워크로드에 적합
- 높은 트랜잭션 속도가 필요한 온라인 트랜잭션 프로세싱
- 대규모 메시징 시스템
- 쓰기기 많은 랜덤 액세스 워크로드를 가진 데이터베이스 애플리케이션
1-1-4. RAID 0+1
- 미러링된 스트라이프
- 디스크 드라이브로의 데이터 스트라이핑이 먼저된 후, 전체 스트라이프가 미러링됨
- 한 드라이브가 고장나면 전체 스트라이프가 고장
1-1-5. RAID 3
- 데이터를 스트라이핑하고 패리티를 사용해 장애에 대비
- 패리티 정보는 전용 드라이브에 저장 => 병목 발생
- 드라이브가 병렬로 동작
- 데이터 백업, 비디오 스트리밍 같은 대규모의 시퀀셜 데이터 액세스를 하는 애플리케이션에 적합
1-1-6. RAID 4
- RAID 3과 비슷하지만, RAID 4의 데이터 디스크는 독립적으로 액세스 가능
- 전체 스트라이프를 읽거나 쓰지 않고도 하나의 디스크의 데이터를 읽고 쓸 수 있음
1-1-7. RAID 5
- 다용도 RAID 구성
- 스트라이핑 사용, 드라이브 독립적 액세스 가능
- RAID 4와의 차이는 패리티 위치
- 패리티는 모든 디스크에 분산
- 읽기가 많은 랜덤 I/O 애플리케이션, 메시징, 데이터 마이닝, 중급 성능 미디어 서버, RDBMS에 적합
1-1-8. RAID 6
- RAID 집합에서 두 디스카가 고장 나는 경우를 대비해 두 번째 패리티 사용
- 이외는 RAID 5와 동일
- 적어도 4개의 디스크가 필요
- 패리티를 전체 디스크에 분산
1-2. RAID가 디스크 성능에 미치는 영향
- 미러와 패리티 RAID구성에서는 쓰기 연산이 더 많은 I/O 부하 발생 => 쓰기 페널티