안녕하세요. 스마일서브 차동훈 입니다.
입춘이 지난지 얼마 안되었습니다. 한 계절의 끝자락에 새로운 계절을 맞이하는 절기가 있는데
해당 절기가 지나면 마음 만큼은 다음 계절에 들어 선 듯 합니다.
어서 날씨가 풀려 몸과 마음을 녹여 주었으면 하는 기대가 생기네요. ^^
이번 포스팅은 불가피하게 생기는 장애와 장애 발생이 높은 작업에 대한 이야기 입니다.
기술지원팀에서는 고객님의 데이터 안전과 스마일서브의 원활한 기술지원 제공을 위해 ‘데이터 백업’ 후 기술지원 요청을 권해드리고 있는데요,
요새 하드웨어적인 장애 또는 기술지원 상의 문제로 인해 고객님의 서비스가 단절되는 상황이 몇 차례 발생되어
뜬금없이 데이터 망실되는 경우에 대해 말씀을 드리고자 합니다.
1. 서버 전원 종료
서버는 전원이 켜있는 동안 장애가 없으나, 전원이 꺼지면 생각하지 못한 장애가 발생 합니다.
대부분 이미 장애가 나 있었으나 전기가 들어가 있는 동안 인지를 못하고 있다가, 전원이 나가는 순간 그 상황을 인지하게 됩니다.
특히 고객님이 무언가 시스템이 정상적인 동작이 되지 않는 상태라 판단하여 운영체제 재설치를 요구 하시는 경우가 있는데,
이때는 추가적인 장애를 예견할 수 있는 부분으로 운영체제 재설치 요청에 앞서 데이터를 백업 해놔야 합니다.
하드디스크의 장애로 시스템이 비정상 동작하며, 데이터 유실이 발생될 수 있기 때문입니다.
이로 인해 백업되지 않은 시스템은 저희 기술지원팀에서도 작업을 도와 드릴 수 없습니다만,
운영체제 재설치가 불가피한 경우 작업의뢰서 또는 전화로 문의 주시면 백업 가능한 다른 절차를 안내 드리고 있습니다.
2. 같은 날 같은 생산 품의 저주
얼마 전, 파워서플라이이가 동시 다발적으로 장애를 일으킨 적이 있습니다.
저희는 해당 상품 제조사를 확인하고 서버실에서 같은 파워서플라이를 사용하는 서버를 전수 조사하고 교체를 진행 한 적이 있는데요,
하드디스크도 마찬가지 입니다.
같은 생산 라인에서 같은 날 생산된 하드디스크는 비슷한 날 장애를 일으키는 경우가 비일비재 합니다.
때문에 운영체제와 데이터용 하드디스크의 제조사와 종류가 같고, 같은 생산 라인, 같은 날 생산해 낸 디스크라면
두 개의 하드 디스크가 같은 시일에 고장이 나 데이터를 모두 날리는 경우가 발생 할 수 있습니다.
레이드 서버의 경우도 보통 같은 종류의 디스크를 장착하여 사용하기 때문에 두개 이상의 하드디스크가 동시에 장애가 발생되어 데이터를 모두 날리는 경우가 비일비재 합니다.
3. 작업자의 실수
운영체제 재설치시 사고 발생 확률은 다른 작업 보다 장애 발생 활률이 높으므로 절대 백업 되지 않은 시스템에서의 운영체제 재설치는 진행하지 않고 있습니다.
백업하지 않은 디스크에 운영체제를 재설치 할 경우 복구가 거의 불가능한 데이터 망실을 가져 오기 때문입니다.
하드디스크가 여러 개가 장착된 시스템은 고객님과의 커뮤니케이션 실수, 생긴것도 모델 번호도 모두 동일한 회사의 동일한 하드디스크,
시스템에 접근하면 어느게 어느것인지 헷갈리는 경우가 비일 비재 한 관계로
작업자가 엉뚱한 하드디스크를 포맷하고 거기에 새로운 운영체제를 한번 더 덮어 써버리는 대형사고를 치는 경우가 종종 발생 합니다.
이 경우 포맷 후 덮어쓰기를 한 상태라 데이터 복구가 아예 불가능 해지는 결과를 발생 시킵니다.
따라서 고객님이 백업용 하드 디스크가 달려 있다고, 운영체제용 디스크에 운영체제 재설치를 요구 하는 경우에도
서버 내 모든 디스크의 데이터를 백업하지 않으면 작업이 불가능 합니다.
[ 대책 ]
예상 못한 데이터 망실이라는 무시무시한 이야기를 꺼냈지만 어떤 일이든 해결책은 있습니다.
‘백업’. 하나 뿐입니다.
서버 한대로 운영을 하시는 분이 많이 계신데, 혹시 HDD 가 소모품인건 알고 계신가요?
쌩쌩한 하드디스크도 24시간 365일 계속 돌기만하면 언젠가 디스크가 수명을 다하고 데이터 손실을 가져오는 경우가 발생합니다.
오랫동안 개발하고 서비스하여 쌓여진 현재의 소중한 데이터를 하나의 디스크 안에만 보관해 둔다면
언젠가 한 순간에 데이터를 잃어버려 누구도 탓하지 못하게 됩니다.
서버 보안도 마찬가지 입니다. 단순히 APM 을 설치하고 개발한 소스를 올려 서비스 하시는 분이 많으신데
시간이 지날수록 APM 의 취약점과 오래된 개발 소스의 헛점이 드러나 해킹을 당해 랜섬웨어에 감염되기도 합니다.
이로인해 재산상의 손실이 발생되거나 심지어 사업을 접는 경우도 보았습니다.
하지만 백업이라는 간단한 방법으로 고객님 데이터의 안전을 보장 할 수 있습니다.
작업자의 PC 또는 별도의 저장소 (서버 외부) 에 데이터 복사본을 저장하여 만약의 사태에 대비하면 그만입니다.
업계에선 “운영에 실패한 서버 관리자는 용서할 수 있어도, 백업하지 않은 서버 관리자는 용서할 수 없다.” 라는 말이 있는데,
그만큼 백업의 중요성을 강조하는 말 입니다.
이 글을 읽어보신 고객님은 이용하시는 서버에 백업 설정이 되어 있는지 다시 확인 해보시고,
미비한 경우 간단하게라도 ‘백업 스크립트’ 등을 이용해 자동 백업을 설정하시고 주기적으로 백업이 잘 되고 있는지 확인 해보시는 것을 권해드립니다.
스마일서브는 방법을 잘 모르시는 고객님을 위해 백업 상품을 제공하고 있습니다.
필요시 CloudV 기술지원팀 (1688-4879, 2번) 으로 연락 주시면 친절히 설명 드리도록 하겠습니다.
– CDP 백업 (이미지 통 백업)
– DR 백업 (분당 KT-IDC 격리 백업)
– 백업스크립트 작성
그럼 ‘서버 운영 재난, 데이터 망실에 대하여 (백업의 중요성)’ 에 대한 글을 마치며,
오늘도 고객님 데이터의 안전과 서버의 무사를 기원합니다.