mobile background

자료실

고가용성 및 재해 복구 : 주요 차이점과 연결 위치


Quick Overview 

고가용성은 작은 중단을 줄이고 신속한 복구를 위해 사용되는 반면, 재해 복구는 대규모 중단에 대비하여 설계됩니다. 이들은 비즈니스의 다양한 운영 시나리오에 대응하기 위해 조합하여 사용됩니다. 여기서는 고가용성과 재해 복구의 차이를 살펴보고, 서로 어떻게 보완하고 교차하는지 알아봅니다. 


고가용성과 재해 복구는 모두 전체적인 비즈니스 연속성을 계획할 때 필수적인 요소입니다. 둘은 다양한 시나리오에서 서로를 보강하며, 운영 중단 발생 시 데이터 손실 위험을 줄이고자 하는 IT팀이 주로 사용하는 접근 방식입니다. 그렇다면 고가용성과 재해 복구를 구분하는 경계선은 무엇이고, 서로 보강하도록 하려면 IT 전문가는 어떻게 해야 할까요? 

 


고가용성과 재해 복구의 차이 

고가용성은 발생 빈도가 대체로 높은 비교적 작은 규모의 중단과 관련된 위험을 완화하고, 재해 복구는 자연 재해와 같이 빈도가 낮지만(아예 발생하지 않는 것이 가장 좋지만) 특별하고 드문 시스템 중단에 대한 안전망을 제공합니다. 재해 복구는 고가용성이 부족한 경우 그 역할을 대신하기도 합니다. 기업은 두 가지를 조합하여 사용함으로써 IT 환경에 닥칠 수 있는 대부분의 문제에 대한 회복탄력성을 갖출 수 있습니다. 

 

그러나 고가용성과 재해 복구는 비즈니스 연속성 계획에서 각자의 역할이 있고, 초점을 두는 부분과 적용 가능성도 각기 다릅니다. 

 


고가용성 

고가용성의 초점은 서비스와 애플리케이션, 전체 시스템을 항상 가동 상태로 유지함으로써 생산적인 업타임을 극대화하는 데 있습니다. 고가용성의 목표는 이따금 발생하는 문제와 심각성이 낮은 중단 상황에서 IT 서비스에 대한 사용자 액세스를 유지하는 것입니다. 

 

고가용성 아키텍처의 일반적인 요소에는 장애 발생 시 백업 시스템을 활성화할 수 있는 페일오버, 그리고 단일 장애 지점을 없애기 위한 이중화가 포함됩니다. 또한 여러 시스템(일반적으로 서버)에 걸친 로드 밸런싱, 즉 부하 분산을 통한 혼잡 감소 기능도 포함됩니다. 


고가용성은 어떤 종류의 서비스 중단에 대응할까요? 고가용성은 단기적인 정전, 디바이스 고장, 서버 충돌, 네트워크 처리량 문제 등의 시나리오에서 가장 큰 가치를 발휘합니다. 

 


재해 복구 

비즈니스 운영의 지속을 목표로 하는 재해 복구는 대규모 중단이 발생한 후 신속하게 사용자가 생산성을 되찾을 수 있도록 설계됩니다. 재해 복구 전략 및 관행은 데이터와 애플리케이션을 정기적으로 백업하고 필요할 때 복원하기 위해 사용하는 소프트웨어까지 확장됩니다. 재해가 발생하면 주 IT 인프라를 사용하지 못하는 상황이 될 수 있으므로 재해 복구 전략에는 운영을 대체할 다른 위치와 이 대체 위치에 장기적으로 의존할 수 있는 준비가 포함되어야 합니다. 


화재, 홍수, 큰 피해를 입힌 사이버 공격, 지진, 장기간 정전과 같은 상황에서 기업은 재해 복구에 의존합니다. 

 


고가용성과 재해 복구는 서로 지원하고 보강하는 관계 

비즈니스 연속성 전략을 고려할 때 재해 복구와 고가용성은 다음과 같이 여러 방식으로 교차합니다. 


  • 관계 - 고가용성은 재해 복구 전략의 일부이며, 전자에서 후자로 매끄럽게 전환된다고 생각하는 것이 좋습니다. 

  • 교차 - 두 가지의 좋은 점을 취합니다. 고가용성 시스템은 완전한 복구를 목표로 설계되지는 않지만 일반적으로 재해 발생 시 복구 시간을 줄일 수 있는 페일오버 기술과 이중화를 포함합니다. 

  • 상호 보완 효과 - 고가용성은 빈도가 높고 영향이 제한적인 중단을 극복하는 데 드는 운영 비용을 낮추는 방법입니다. 이는 재해 복구가 다운타임을 줄이고 대규모 중단으로 인한 비즈니스의 불능을 방지하는 방식과 일맥상통합니다. 

  • 데이터 보호 – 마찬가지로, 두 접근 방식 모두 데이터 손실을 방지합니다. 고가용성은 중복 시스템에서 데이터와 애플리케이션을 동기화하여 재해 발생 시 복제 및 신속한 복구가 가능하도록 대비합니다. 

  • 의식 제고 – 가용성과 재해 복구를 위한 계획은 위험 및 비즈니스 연속성에 대한 기업의 인식을 높이고 모든 사용자가 회복탄력성을 중시하는 문화를 조성합니다. 

  • 끊임없는 경계 - 고가용성과 재해 복구를 올바르게 구현했다면 정기적인 테스트를 통해 필요할 때 관련 인프라에 액세스할 수 있는 준비된 상태를 유지해야 합니다. 

  • 계층화된 대비 – 두 접근 방식은 서로 다른 시나리오에 적합하므로 데이터 손실 위험을 여러 계층으로 관리할 수 있습니다. 이를 통해 전체적인 방어력을 강화하고 위험에 대한 노출을 줄일 수 있습니다. 


 

고가용성과 재해 복구 구축 

고가용성과 재해 복구를 나누는 선이 항상 명확한 것은 아닙니다. 


고가용성이라고 하면 서버, 스토리지, 데이터 등이 떠오릅니다. 이 중에서 데이터가 가장 중요하므로 재해 복구는 데이터를 최대한 신속하게 다시 사용할 수 있도록 해야 합니다. 따라서 고가용성 시스템에 재해 복구를 위한 방법을 구축해 넣을 수 있습니다. 


목표는 시스템의 회복탄력성을 구축해서 프로덕션 사이트의 단일 장애 지점이 대규모 문제가 되지 않도록 하는 것입니다. 또한 프로덕션 사이트에 큰 문제가 발생하는 경우에도 재해 복구는 고가용성과 밀접하게 연관되어 진행됩니다. 진행에 시간과 비용이 조금 더 소요될 수 있지만 고가용성에 투자하지 않는다면 재해 발생 시 신속한 복구도 기대할 수 없습니다. 

 


고가용성 및 재해 복구 사용례 

회사에 완전히 복제되는 두 개의 데이터센터가 있다고 가정해 보겠습니다. 둘 중 하나가 홍수로 인해 장애가 발생하여 다른 하나가 그 역할을 대신합니다. 홍수는 재해에 해당하지만 여기서 사용자의 생산성을 유지시키는 것은 고가용성입니다. 프로덕션을 중단하고 조치를 취할 필요가 없었으므로 재해 복구가 아닙니다. 

 

프로덕션을 중단하고 재해 복구 모드로 전환할 필요가 없도록 고가용성 계획에 재해 복구 기능을 내장해야 할까요? 백업이 있다 해도 복원할 수 없다면 아무 쓸모가 없으므로 비즈니스 연속성을 위해서는 백업을 복원할 수 있도록 해야 합니다. 

 

데이터의 가용성을 높게 유지하는 데 있어 문제는 실시간으로 복제한 데이터를 지속적으로 폐기한다는 것입니다. 그 다음에는 무엇을 하나요? 백업으로 가서 데이터의 이전 복사본을 복원해야 합니다. 어느 시점에 재해 복구로 전환해야 할까요? 데이터센터 전체가 오프라인 상태가 된다면 재해라고 할 수 있겠지만 서버 한 대가 다운되는 경우도 재해일까요? 고도의 회복탄력성을 갖춘 시스템에서 데이터가 손실되어 이를 복원해야 하는 상황에서, 여러분은 즉시 재해 복구 모드로 전환하여 데이터를 복구했습니다. 

 

두 가지가 교차되는 부분이 있나요? 물론 있습니다. 두 가지가 밀접하게 연관되나요? 예, 재해 복구 계획은 고가용성 시스템을 포함해야 합니다. 서비스, 스토리지, 플랫폼, 애플리케이션, 데이터에 이르기까지, 모든 부분에 대한 완전한 보장을 구축해야 하기 때문입니다. 업타임을 1분도 잃고 싶지 않다면 계획의 다른 부분, 즉 백업에서 복원하기를 실행해야 합니다.  


데이터 보호 전략에서 비즈니스의 "재해"를 정의하는 것이 중요한 이유가 여기에 있습니다. 



고가용성과 재해 복구를 저울질할 때 유의해야 할 고려 사항 

 


  1. 비즈니스의 “재해” 정의 

데이터베이스 중 하나가 ERP(enterprise resource planning) 애플리케이션의 요청에 더 이상 응답하지 않는 경우를 상상해 보십시오. 테이블 하나가 손상되었을 수도, 전체 SQL 서버군이 다운되었을 수도 있습니다. 전자의 경우 작은 규모의 중단으로부터 시스템을 보호하는 고가용성 솔루션으로 충분히 대처가 가능합니다. 후자의 경우 대규모 중단에 대한 보호 기능을 제공하는 재해 복구가 필요할 수 있습니다. 


그러나 비즈니스 자체는 무엇을 재해로 간주하나요? 커피메이커 고장부터 데이터센터 화재에 이르는 넓은 사고의 범주에서 여러분의 기업이 재해로 분류하는 것은 무엇인가요? 

 

관건은 심각도 수준입니다. 예를 들어, 네트워크 라우터가 다운되는 정도라면 대부분 기업은 재해 복구를 필요로 하지 않습니다. 물론 라우터 다운의 영향이 워낙 커서 재해로 분류해야 하는 경우도 있지만, 대부분은 단일 장애 지점에서 가용성이 손실되는 정도일 것입니다. 경우에 따라 고가용성의 부재가 대부분의 재해 시나리오 못지않게 많은 위험과 골칫거리를 수반할 수도 있습니다. 

 


2. 비즈니스 보험 요구사항 살펴보기 

보험 회사가 특정 수준의 데이터 보호를 충족할 것을 요구하고 충족하지 않을 경우 보험료를 할증하거나 보험 가입을 아예 거절하는 경우는 드물지 않습니다. 이유가 무엇일까요? 건물이나 용광로처럼 이제 데이터도 하나의 자산이기 때문입니다. 

 

보험사가 제시하는 보험 자격을 갖추려면 데이터 백업을 두는 데 그치지 않고 여러 개의 복사본을 유지하고 이를 암호화하고 변경 불가 백업을 사용해야 합니다. 또한 보험사는 비즈니스 연속성과 재해 복구 계획에 대해 면밀히 캐묻습니다. 

 


3. 재해 복구 계획을 문서화 

이런 보험 요구사항을 충족하려면 직면하는 가동 중단의 각 유형과 심각도에 따라 취할 단계를 계획하고 문서화하는 것이 좋습니다. 여러 사용자가 중요한 이메일을 실수로 삭제하는 경우, 또는 가상 머신 50개가 갑자기 손상되거나 손실되는 경우 어떤 조치를 취하게 되나요? 사전에 절차를 정해두면 문제가 발생할 때 이를 귀중한 지침으로 활용할 수 있습니다. 또한 전체 IT 환경을 다시 만들 방법을 고민하는 것보다 비교적 소규모의 중단을 한 번에 하나씩 복구할 방법을 구상하는 편이 더 쉽습니다. 


관련된 데이터의 상대적 중요도에 중점을 두고 계획을 수립하십시오. 예를 들어 얼핏 이메일이 가장 우선 순위가 높아 보일 수 있지만 전자상거래 웹사이트의 기반 데이터베이스는 어떨까요? 비즈니스에 실질적인 가치를 주는 모든 거래가 저장되는 이 데이터베이스가 수익에 더 중요하지 않을까요? 각 데이터 집합을 점검하면서 "이 데이터 집합에 문제가 발생하면 어떻게 될까?"를 자문해 보십시오. 여기에 재해 복구 프로세스를 적용하고 여러 서버에 걸쳐 고가용성을 구현하고 데이터 집합을 정기적으로 백업하십시오. 이렇게 해서 이 시스템에 대한 계획을 완성하고, 다음 시스템으로 넘어가 계획을 수립할 수 있습니다. 

 

여러 개의 소규모 계획을 마련한 다음에는 대규모 중단이 발생할 때 이러한 계획을 실행할 순서를 설정할 수 있습니다. 무엇보다, 이와 같은 방식으로 계획을 수립하고 문서화하면 기관 지식 전체가 관리자 한 사람의 머릿속에만 있게 되는 상황을 방지할 수 있습니다. 

 


4. 변경 제어 시행 

고가용성 및 재해 복구 계획을 마련할 때는 견고하고 기업 시스템의 잠재적 성장과 호환되는 변경 제어 프로세스를 구축해야 합니다. 업데이트, 패치, 업그레이드를 포함한 시스템 변경은 거의 항상 문제를 야기하지만, 견고한 변경 제어를 구현하면 이런 변경이 미치는 영향을 예상할 수 있습니다. 

 

변경 제어를 철저하게 시행하는 기업은 소수입니다. 이들 기업은 백업 및 데이터 보호가 제공될 때까지 새로운 프로덕션 애플리케이션 또는 데이터 집합의 배포를 금지하는 규칙을 둡니다. 


이는 현명한 규칙이지만 기업은 보통 그 반대로 행동합니다. 정신없이 바쁜 IT팀이 백업 방법을 마련하기도 전에 새로운 워크로드를 프로덕션에 투입하는 경우가 훨씬 더 많습니다. 현재의 백업 소프트웨어가 이 워크로드에 맞지 않는다는 것을 뒤늦게 깨닫게 되면 문제의 워크로드 하나만을 위한 새 백업 제품을 구매해야 합니다. 더 나쁜 경우는 "나중에 처리하자"고 일을 미룬 채 애플리케이션 또는 데이터 집합이 영영 백업되지 않는 채로 방치하는 것입니다. 따라서 이와 같은 변경에 대한 제어가 필요합니다. 

 


결론 

가장 먼저 할 일은 데이터 보호를 위해 각 워크로드를 평가하고 다음의 세 가지 주요 질문에 대한 답을 찾는 것입니다. 

 

  • 이 워크로드에 고가용성을 구현해야 하는가? 

  • 이 워크로드에 재해 복구가 필요한가? 

  • 이 워크로드를 백업해야 하는가? 

 

우선 순위를 지정하다 보면 다른 요소보다 더 중요한 워크로드와 엔드포인트를 발견하게 됩니다. 예를 들어, 인쇄 서버는 평상시 업무에는 중요할 수 있지만 재해 복구 시에는 비즈니스가 평상시 상태가 아니므로 가장 중요한 데이터 보호에 중점을 두어야 합니다. 소규모 중단에 초점을 두는 고가용성과 대규모 중단에 초점을 두는 재해 복구를 결합하면 비즈니스의 번영에 필요한 회복탄력성과 연속성 계획을 수립할 IT 역량을 갖출 수 있습니다. 


가용성 확보 혹은 재해 복구 계획에 어려움을 겪고 계시거나 관련 솔루션에 대해 궁금한 점이 있으시면 언제든 퀘스트소프트웨어 코리아로 문의주시기 바랍니다. 😀 



퀘스트소프트웨어코리아(주)

서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600

전자 메일 KoreaMarketing@quest.com 


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB


퀘스트소프트웨어코리아(주) 서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600 | 전자 메일 KoreaMarketing@quest.com


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB