오늘은 제가 실험했던 3ware 레이드 10 장애복구 실험에 관해 정리합니다.
실험할 주제와 서버의 구성은 아래와 같습니다.
주제 : Subunit로 묶여있는 하드디스크 두개를 실수로 제거했을경우
어떻게 복구를 진행해야할지에 관한 실험
서버 연식 : 1년 반
서버 OS : Windows 2012 데이터 센터
레이드 구성 : 레이드 10
하드디스크 구성 : 1TB 하드디스크 8개
주의사항 : 이번 실험은 레이드에 관한 경험을 쌓고자 독자적으로 진행하는 실험입니다.
이 글은 참고용으로 보시되 실제로 구동중인 서버로 따라하시는것은 절대 권장하지않습니다.
따라하시다가 데이터 유실등의 문제가 발생하여도 스마일서브에서는 절대 책임을 지지않습니다.
1. 오늘 제가 실험할 서버입니다. 3ware 레이드 카드이며 레이드는 10으로 설정되어있습니다.
보시면 하드디스크는 ST1000DM003 기종이며 대부분의 모델명이 1CH162로 되어있는 부분이 확인됩니다.
현재 Vport 4번의 기종이 다른 기종과는 다릅니다. 이 부분에서 Subunit 0가 리빌드가 한번 진행됐을것 같음을
주측하여 이번 실험은 Vport 4, 5번을 일시적으로 제거 후 장애 사항을 발생시켜 그것을 복구해보는 작업을
진행할겁니다.
2. 윈도우 설정에는 OS 디스크가 C 드라이브로 레이드 디스크가 D 드라이브로 되어있습니다.
3. 실험을 위해 제가 Hyper-V로 올려둔 가상서버입니다. 가상서버 이미지는 레이드 디스크인 D드라이브에 위치합니다.
이 부분은 레이드 10의 장애 사항 발생시 가상서버는 어떻게 될까 궁금하여 올렸습니다.
4. 먼저 Vport 4번을 제거 했습니다.
5. Vport 4를 제거하면 DEGRADED가 발생되지만 당장 D드라이브가 사라지거나 가상서버가 종료되지
않은점이 확인됩니다. 이 부분은 아직 Vport 5가 정상적으로 구동이 되기 때문입니다.
6. 이번엔 Vport 5번를 제거하였습니다.
7. Subunit 0에 연결된 디스크가 모두 제거되어 INOPERABLE(작동불능) 상태로 변하였습니다.
8. 이때의 가상 서버는 2~3분을 버티다가 ‘가상 컴퓨터 구성 저장소에 연결할 수 없음’ 상태가 되며 이용할수 없는것을
확인하였고 마지막에는 가상서버가 강제로 종료되는것을 확인하였습니다.
9. D 드라이브가 완전히 빠져버렸습니다.
10. 레이드 10을 복구 하기 위해 Vport 4를 다시 넣어보겠습니다.
11. 장착 후 Vport 4는 현재 정상적으로 인식이 되나 아직은 사용이 불가능한 상태입니다. D드라이브도 원래대로
돌아오지 않았습니다.
12. 리부팅을 진행합니다.
13. 3ware 또는 메가레이드의 경우 부팅시 메세지가 확인됩니다. VERIFYING(검증) 부분이 나타나며 부팅이
진행되었습니다.
14. 리부팅을 해도 D 드라이브가 확인이 되지 않는점이 있었습니다.
15. 영문을 알수없어 Vport 5번을 끼우니 갑자기 Vport 4가 DEGRADED 상태로 변하였습니다.
15. 하지만 D 드라이브가 인식이 되지 않아 다시 리부팅을 진행했습니다. 부팅중 이번에는 다른 결과를 확인했습니다.
subunit Mirror이 적용되어있는게 확인되었습니다. 어느 이유인지는 모르지만 Vport 4는 리빌드가 진행되고
있었습니다.
16. D드라이브가 추가 되었고 리빌드도 순조롭게 진행되고 있었습니다. 테스트로 올린 가상서버도 물론 정상적으로
구동되는것을 확인하였습니다. 리빌드의 경우 레이드 카드 설정에서 오토 리빌드 설정이 걸려있어서 자동적으로
리빌드가 진행된것으로 확인됩니다.
17. 리빌드가 완료된것을 확인하였습니다.
앞으로 2 ~ 3번더 각각 다른 장애를 일으켜서 그것을 복구해보는 실험을 시간이 날때 진행해보고자합니다.
이 글을 봐주시고 레이드에 관련된 충고사항이 있다면 말씀해주세요. 감사합니다.
이번 레이드 실험
Subunit로 묶여있는 하드디스크 두개를 실수로 제거했을경우 복구 방법에 관한 실험
다음 레이드 실험 – 1
하드디스크를 동일하게 두개를 ‘모두’ 제거 후 서버에 기존 하드디스크 1대, 신규 하드디스크 1대를 장착하면
D드라이브가 정상적으로 나타나는지와 리빌드를 진행할수 있을지.
다음 레이드 실험 – 2
하드디스크를 동일하게 두개를 ‘모두’ 제거 후 기존 하드디스크 1대를 신규 하드디스크에 카피하여
서버에 카피된 신규 하드디스크와 또다른 신규 하드디스크를 장착하면 레이드 10을 살릴수 있을지.