mobile background

자료실

“RPO 및 RTO 단축의 지름길” 지속적 데이터 보호의 이해 – 2부

지속적 데이터 보호(Continuous Data Protection, CDP)는 변경된 모든 데이터를 백업하고 변경 로그를 유지해 이전 시점으로 시스템을 복원합니다. 데이터를 훨씬 자주 백업하므로 데이터 손실 위험이 낮지만, 모든 상황에 적합한 기술은 아닙니다. 2부에서는 CDP의 장단점과 구현을 위한 베스트 프랙티스를 살펴봅니다. 

 


레거시 백업 vs. 지속적 데이터 보호 

CDP에서는 끊임없이 변경되는 데이터를 지속적으로 보호하는 것이 가장 중요합니다. 반면 레거시 백업 전략은 변경되는 데이터를 보호하는 역할을 하는 경우가 많습니다. 모든 기업은 2가지 범주의 데이터를 모두 처리하므로 개별적인 접근 방법을 결정해야 합니다. 

 

예를 들어, 항상 구매 트랜잭션을 생성하는 웹 기반 매장이 있는 전자상거래 회사에 대해 생각해 보겠습니다. 이 회사에는 최전방 시스템이 곧 생명줄입니다. 회사 측은 이 시스템의 RPO와 RTO를 줄이고자 합니다. 지속적인 보호는 재해 발생 시 트랜잭션이 손실될 위험을 낮춰줄 수 있습니다. 

 

한편 매장은 거의 변경되지 않는 수천 개의 이미지를 표시하는데, 이런 정적 콘텐츠는 레거시 백업에 적합합니다. 가상 데스크톱 인프라(VDI)와 가상머신 역시 거의 변경되지 않습니다. 많은 공간을 차지하는 이런 파일은 매우 중요하므로 손실되면 안 됩니다. 그러나 그 안의 데이터는 변경되는 일이 거의 없으므로 레거시 백업이 적합합니다. 

 


‘진정한’ CDP vs. ‘거의 지속적인’ CDP 

진정한 의미의 CDP는 데이터에 대한 모든 변경이 즉각 인식돼 백업되는 것을 의미합니다. 모든 트랜잭션이 주 시스템과 백업 시스템에 모두 기록되므로 재해가 닥쳐도 아무것도 손실되지 않습니다. 복원이 필요하다면 백업 시스템에 필요한 모든 것이 있습니다.  

 

‘거의 지속적인’ 데이터 보호는 이와 다릅니다. 여기서는 분 단위로 세분화되는 주기적인 저장 지점을 사용합니다. 재해가 발생하면 그 몇 분의 저장 간격에 해당하는 데이터만 재해에 노출됩니다. 일반적으로 하루에 한 번 백업하는 레거시 데이터 백업과 비교하면 데이터 손실 위험이 대폭 낮아집니다. 

 

이전 기간 종료 시점 이후의 데이터를 잃을 수 있으므로 일정한 수준의 데이터 손실 위험이 상존합니다. CDP의 목표는 현실적으로 가능한 가장 짧은 기간을 구성함으로써 이런 위험을 줄이는 것입니다. 1시간으로 설정해도 문제없는 경우도 있으나, 5분 간격으로 백업하는 기업도 많습니다. 이는 진정한 지속적 데이터 보호를 위한 현실적인 수치입니다. 전자상거래 사이트의 맥락에서 5분 내에 발생 가능한 트랜잭션이 몇 개인지 생각해 보십시오. 트랜잭션은 하나라도 손실되면 안 되므로 이 기간을 짧게 설정하는 것이 원하는 효과를 얻기 위한 중요한 요소가 됩니다. 

 

요약하면, 거의 지속적인 데이터 보호는 모든 변경에 대한 지속적인 실시간 보호가 아니라 짧은 간격(짧지만 어쨌든 간격은 존재함)을 두고 저장 지점을 두는 것을 의미합니다. 

 


CDP의 이점 

주요 이점은 백업에 필요한 스토리지 공간이 비교적 적다는 것입니다. 가용한 스토리지 공간이 일찍 바닥날수록 백업 보존 기간은 짧아지고 그만큼 더 빨리 백업을 버리거나 다른 곳으로 옮겨야 합니다. CDP를 사용하면 더 많은 백업을 저장할 수 있고, 동일한 스토리지 용량에서 보존 기간이 더 길어집니다. 


또한 동일한 크기의 공간에 더 많은 데이터를 저장할 수 있으므로 비용도 낮아집니다. 데이터 중복 제거(데이터 백업 세트에서 중복된 데이터 블록을 찾아 제거하는 프로세스)는 CDP를 실현할 수 있게 해주는 기술입니다. 중복 제거는 가용한 공간 내에 최대한 많은 데이터를 저장하기 위한 핵심입니다. 

 

또한 지속적 보호에는 백업에 의해 생성되는 네트워크 트래픽과 이런 트래픽의 네트워크 대역폭 소비, 2가지를 모두 줄이는 효과가 있습니다. 짧은 기간을 두고 종일 데이터를 보호하는 경우 데이터의 대역폭 사용량을 최소화하는 것이 좋습니다. 그렇지 않으면 백업으로 인해 네트워크가 포화되어 모든 사용자의 트래픽 속도가 저하됩니다. 

 

이런 모든 이점(영구 증분 전략, 합성 전체 전략, 중복 제거)이 결합되어 솔루션을 만듭니다. 

 


CDP의 단점 

레거시 백업은 비교적 단순합니다. 정립되고 잘 알려진 기술이며, 하드웨어 요구사항도 평이합니다. 반면 CDP는 스토리지 디바이스에서 지속적으로 I/O를 생성합니다. 데이터의 양에 보조를 맞출 수 있는 하드웨어에 더 많은 돈을 투자할 준비가 되어 있어야 합니다. 따라서 잠재적으로 가장 큰 단점은 레거시 백업 하드웨어가 충분히 빠르지 않아 데이터를 충분히 수집할 수 없는 것입니다. 


또 다른 단점은 합성 전체 백업과 관련됩니다. 백업에 의해 생성되는 I/O 외에, 합성 전체 백업은 증분 조각을 합치고 새 전체 백업을 빌드하면서 상당한 I/O를 생성합니다. 레거시 시스템에는 합성 전체와 같은 것이 없으므로 I/O의 급증에 대처하기 위한 기능이 없습니다. 그러나 적절히 구성된 지속적 데이터 보호 시스템의 아키텍처에는 이를 반영하는 소프트웨어와 하드웨어가 포함됩니다. 

 

CDP 구현 과정에서 저지르는 실수 

레거시 백업은 자주 변경되지 않는 데이터에 적합하고 CDP는 계속해서 변화하는 데이터에 적합합니다. 이 관계를 반대로 사용하려는 기업은 곧 한계에 직면하게 됩니다. 


또한 기업은 3-2-1 백업 전략을 무시하는 실수도 저지를 수 있습니다. 항상 3개의 데이터 복사본을 유지하고 그 중에서 2개는 로컬의 서로 다른 미디어 형식에 저장하고, 1개는 오프사이트(멀리 떨어진 곳 또는 클라우드)에 저장한다는 규칙입니다. 이 규칙은 재해 이후 복원해야 할 때를 대비해서 데이터의 중복 복사본을 항상 확보할 수 있게 해줍니다. 제대로 된 데이터 보호 아키텍처라면 3-2-1 규칙을 반영할 것입니다. 비용 절감을 위해 전체 아키텍처를 구현하지 않는 기업은 오프사이트 데이터 복사본이 없는 상태에서 재해에 직면할 수 있습니다. 

 


구현을 위한 베스트 프랙티스 

가장 중요한 것은 백업하는 데이터의 종류에 초점을 두는 것입니다. 지속적으로 변화되는 데이터인가요, 거의 변경되지 않는 데이터인가요? 답에 따라 각각 CDP와 레거시 백업이 적합합니다. 그 이후에 필요한 양의 I/O를 처리할 수 있는 스토리지 하드웨어에 대한 의사 결정을 내릴 수 있습니다. 

 

또한 증분 백업을 위한 시간도 살펴야 합니다. 하드웨어에 충분한 여유를 유지하면서 얼마나 자주 증분 백업을 실행할 수 있는지를 파악하십시오. 데이터 보호가 지속적으로 이뤄지도록 일요일에 복원하고 백업을 테스트하는 경우와 같이 비일상적인 상황을 반영해야 합니다.  

 

매시간 보호하고자 하지만 증분 변경을 백업하는 데 90분이 걸리는 상황을 가정해 보겠습니다. 이는 매시간 보호가 되지 않는다는 것을 의미합니다. 여기서 선택지는 2가지입니다. 기간을 90분으로 늘리거나 하드웨어를 조정해 모든 데이터를 한 시간 내에 수집하는 것입니다. 


실행 가능한 CDP 솔루션은 백업의 중단을 방지합니다. 설정된 기간 요건을 충족하고 필요할 때 복원을 지원하면서 지속적으로 작업을 수행할 수 있도록 시스템에 충분한 여유 용량을 확보해야 합니다. 

 

데이터 백업 및 관리에 어려움을 겪고 계시거나 관련 솔루션에 대해 궁금한 점이 있으시면 언제든 퀘스트소프트웨어 코리아로 문의주시기 바랍니다. 




퀘스트소프트웨어코리아(주)

서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600

전자 메일 KoreaMarketing@quest.com 


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB


퀘스트소프트웨어코리아(주) 서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600 | 전자 메일 KoreaMarketing@quest.com


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB