이번 글은 3Ware Raid 9750에서 리빌드를 하는 방법에 대해 적습니다.
3Ware나 MegarRaid 같은 경우는 대부분 메뉴얼이 영어로 되어있어 읽기에 않은 애로사항이있습니다.
(가끔 일본어판으로 된것도 몇개 보이긴합니다만 그것도 번역하려면 힘들죠)
현재 운영하는 서버의 레이드는 10으로 설정되어있으며 리빌드에 관해 이미 알고 계신분들도 있겠지만
모르시는분들은 참고차 한번 읽어보시면 좋을것같습니다.
준비물
1. 하드디스크 – 동일한 업체의 기종과 용량의 하드디스크가 필요
(없다면 타사의 같은 용량의 하드디스크를 이용해도 되지만 권장하지 않습니다.)
2. 전동드릴 & 나사 – 전동드릴이 없다면 일반 드라이버로 대체해도되며 나사의 경우에는 하드디스크에 조여져있던
나사를 육안으로 상태를 파악하고 심각하게 낡았다면 미래를 위해 교체해주시는것이 좋습니다.
3. 평정심과 침착함 – 실수 하나로 레이드안에 있는 데이터를 다 날릴수도 있습니다. 작업전에 심호흡 한번 하고 작업을
진행 하는것을 매우 추천합니다.
경고
이 글은 충분한 실험을 거치고 게시한글입니다 하지만 서버의 특성에 따라 리빌드에 실패할 가능성이 있으므로
만에하나 이 글을 참고하신후에 따라하시다가 발생된 문제에 관해서는 스마일서브에서 책임을 지지 않습니다.
리빌드 진행
1. 웹으로 3ware에 접근한후 로그인을 하여 아래의 위치로 간후 리빌드의 설정을 변경합니다.
이렇게 변경하는 이유는 문제있는 디스크를 가상적으로 제거할때 자동적으로 리빌드되는것을
막기 위함입니다.
# Management > Controller Settubgs
# Auto Rebuild : Enabled > Disabled
2. 아래의 위치로 이동하여 문제있는 디스크를 확인한후 [Remove Drive]를 클릭합니다.
메시지가 나오면 확인을 눌러주세요.
# Management > Maintenance
3. Rescan Controller을 클릭하여 문제있는 디스크가 정상적으로 제거 되었는지 확인합니다.
확인이되면 하드디스크, 전동 드릴등을 가지고 가셔서 문제있는 하드디스크를 교체합니다.
작업전에 확인해보면 Unit0에 Subunit 2로 VPort 2와 VPort 4가 연결되어있었음을 알수있습니다.
하드디스크 교체시 이 부분을 자세히 확인하시기 바랍니다.
실수로 정상적으로 운영되는 VPort 2를 제거하면 서버의 레이드는 I/O 에러가 발생하며 사용할수 없게됩니다.
(2분 ~ 5분내로 정상적인 하드디스크를 다시 적재하고 서버를 리부팅하면 레이드가 운좋게 살아나는 경우가 있으나
그렇게 되지 않을경우도 많으므로 평점심을 유지하고 하드디스크를 교체하시기 바랍니다.)
4. 하드디스크를 교체후 Rescan Controller을 시간차를 두어 두번정도 클릭합니다.
한번 클릭한 경우 하드디스크가 정상적으로 인식이 안될수도 있기 때문입니다.
그후 이렇게 진행합니다.
# Unit 0 클릭
# Rebuiid Unit 클릭
5. 그후 VPort 4 옆의 체크박스를 클릭한후 OK 버튼을 클릭합니다.
6. REBUILDING 75% 가 나오며 리빌드가 시작되었습니다.
7. 1번에서한 리빌드 설정을 원래대로 돌려놓습니다.
8. 레이드가 정상적으로 리빌드 되고있는지 확인하기위해 아래로 이동합니다.
# Information > Unit Information
# 0 을 클릭
9. 여기서 리빌드가 정상적으로 진행되고 있는지 확인할수 있습니다.
10. 리빌드에 걸리는 시간은 꽤나 많이 소요됩니다. 그동안 서버가 정상적으로 운영이 되는지 모니터링을 합시다.
11. 정상적으로 문제있던 부분의 리빌드가 완료되었습니다.
서버에서 확인되는 로그(리눅스의 경우)
리빌드 작업을 진행하는 동안 서버의 메세지로그에는 아래와 같은 내용이 나옵니다.
작업전에 tail -f /var/log/messages를 이용하면 서버가 어떻게 동작하고 있는지 확인할수 있습니다.
kernel: 3w-sas: scsi6: AEN: WARNING (0x04:0x0019): Drive removed:phy=4.
– 디스크 4번이 제거되었습니다.
kernel: 3w-sas: scsi6: AEN: INFO (0x04:0x001A): Drive inserted:phy=4.
– 디스크 4번이 적재되었습니다.
kernel: 3w-sas: scsi6: AEN: INFO (0x04:0x000B): Rebuild started:unit=0, subunit=2.
– 리빌드를 진행합니다.
[…] 3Ware의 기본 준비는 여기를 참고해주세요 : 3Ware Raid Controller 하드디스크 리빌드(Rebuiid) 하기 […]