자료실

백업 데이터 관리에 꼭 필요한 데이터 최적화 전략 3가지


백업 데이터 관리에 꼭 필요한 데이터 최적화 전략 3가지


신속 정확하게 예산 내에서 데이터를 백업하고 복구해야 한다는 압박이 점점 커지는 상황에서 클라우드에 저장된 데이터 증가는 백업과 복구를 더욱 복잡하게 만들고 있습니다. 보존하고 관리해야 할 데이터의 양이 속수무책으로 증가하고 있기 때문에 모든 데이터를 백업하기란 어렵습니다. 이는 다음 4가지 요소에 영향을 미칩니다. 


  • 소비하는 스토리지의 양 

  • 관련된 스토리지 비용의 상승 

  • 백업 및 복구 윈도우의 증가 

  • 사이버 공격이나 대형 사고 이후의 복구를 위한 준비성 



많은 조직의 백업 및 복구 속도가 위험할 만큼 느려지고 클라우드 스토리지 비용이 증가하고 있으며, 결과적으로 진정한 재해 복구 준비성을 갖추지 못하고 있습니다. 그렇다면 백업 및 복구 요구 사항을 충족하면서 데이터 증가가 미치는 영향에 대처하려면 어떻게 해야 할까요? 


이번 포스팅에서는 데이터 최적화가 이와 같은 여러 과제를 어떻게 해결하는지 살펴보면서 3가지 최적화 기법과 이런 기법을 사용하면 좋은 최적의 시점을 알아보겠습니다. 


핵심 데이터 최적화 전략 3가지

백업 최적화 측면에서 데이터 백업을 최대한 활용하는 핵심 전략은 3가지로 정리할 수 있습니다. 


  • 데이터 중복 제거 

  • 데이터 압축 

  • 스토리지 티어링 


각각의 접근 방식과 이 방식을 백업 프로세스에 적용할 시점에 대해 자세히 살펴봅시다. 


- 데이터 중복 제거

데이터 중복 제거 프로세스는 중복된 데이터 블록을 찾아서 제거하는 과정입니다. 파일 내의 데이터를 검사하고 이전 백업 이후 변경된 블록만 저장합니다. 중복 제거는 인덱스를 사용해서 중복 제거된 고유한 블록 또는 파일을 추적합니다. 


파일의 중복 블록이 발견되면 해시(블록) 또는 파일 스텁(파일)으로 대체되고 그 결과 저장되는 백업 데이터의 전체적인 크기가 줄어듭니다. 구현 방법에 따라 다르지만, 중복 제거는 90% 이상의 공간 절약 효과를 달성할 수 있습니다. 


블록 수준 중복 제거는 일관적인 블록 크기(예를 들어 4K, 8K, 16K, 32K)를 전제합니다. 일치 항목을 더 많이 찾고 크기를 최대한 줄이려면 중복 제거되는 백업 데이터의 유형에 따라 더 큰 블록 크기가 적합할 수도 있고 작은 블록 크기가 적합할 수도 있습니다. 데이터에서 패턴을 파악해 사용되는 블록 크기를 조정하고 블록 시작 및 끝 지점을 정렬하여 더 많은 공간을 절약하는 가변 블록 중복 제거도 있습니다. 


데이터 중복 제거는 프로세서 사용량이 많을 수 있으므로 몇 가지 고려해야 할 사항이 있습니다. 


  • 원본 vs. 대상 – 중복 제거가 실행되는 시점이 클라우드에 백업되기 전인가(원본), 클라우드에 백업된 이후인가(대상)? 

  • 작업 수준 vs. 전역 – 중복 제거가 단일 백업 작업 내의 데이터에 대해서만 수행되는가(소수의 VM), 모든 백업 작업에 걸쳐 수행되는가(전체 엔터프라이즈)? 

  • SaaS 데이터 중복 제거 – 백업 전략에 마이크로소프트 365와 세일즈포스 인스턴스 및 기타 주요 클라우드 애플리케이션이 포함된다면 그 데이터도 중복 제거해야 합니다. 

  • 소프트웨어 정의 vs. 어플라이언스 기반 – 중복 제거는 대부분 백업 솔루션에 존재하는 기능이지만, 전용 솔루션을 원하는 조직이 많습니다. 물리적 어플라이언스를 사용하는 솔루션도 있는데, 이 경우 하드웨어 문제, 갱신 등에 대해서도 신경을 써야 합니다. 


- 데이터 압축

백업되는 데이터를 클라우드로 보내기 전에 압축하는 작업입니다. 압축하면 워크로드와 클라우드 백업 간에 이동하는 데이터의 양이 줄어듭니다. 프로세서 집약적인 작업인 만큼 지연이 발생하므로 백업 및 복원 프로세스 중에 원하는 압축 비율과 발생하는 지연 사이에서 균형을 찾아야 합니다. 좋은 압축 비율은 일반적으로 압축된 크기와 원본 데이터 크기가 1:10 이하입니다. 데이터 형식마다 압축 비율이 다르지만, 1:12면 매우 뛰어난 압축 비율로 간주합니다. 


압축은 태생적으로 프로세서 사용량이 많은 작업이므로 애초에 압축을 해야 하는지 고민할 수 있습니다. 하지만 답은 ‘해야 한다’입니다. 다만 백업 및 복구 속도를 저하하지 않는 선에서 압축의 이점을 추구해야 한다는 점에 유념하십시오. 


- 스토리지 티어링

데이터 중복 제거와 데이터 압축은 온프레미스 및 클라우드 소스와 타겟에 모두 좋은 옵션입니다. 그러나 클라우드 스토리지에는 비용 절감을 위해 활용할 수 있는 옵션이 하나 더 있습니다. 바로 스토리지 티어링입니다. 클라우드 스토리지 업체는 여러 스토리지 티어를 제공하는데, 일반적으로 비용을 낮추는 대신 성능과 액세스 속도를 희생합니다. 티어는 ‘콜드 쪽으로 내려갈수록(colder)’ GB당 비용은 낮지만 속도는 훨씬 느립니다. 스토리지 티어링에서 클라우드 백업 비용을 최적화하는 최선의 방법은 자동화된 정책 기반 접근 방법을 사용하는 것입니다. 보존된 백업을 일정 시간이 지난 후 콜드 스토리지 티어로 옮겨 비용을 절감할 수 있습니다. 


각 티어와 관련된 다른 요소도 있습니다. 가용성, 최소 저장 기간, 객체별 최소 저장 요금 등이 대표적입니다. 복구 중에는 성능과 관련된 모든 요소가 분 단위로 측정되는 것이 좋습니다. 예를 들어, AWS에서 ‘최하위 콜드’ 스토리지 티어를 사용할 경우 첫 바이트 지연(백업의 첫 바이트가 복구되기 전까지 기다려야 하는 시간)은 ‘시간(hours)’으로 표기됩니다. 즉, 몇 시간 동안 복구가 시작되지 않을 수 있다는 의미입니다! 


비용 vs. 속도 : 적절한 균형을 찾는 방법

사용할 수 있는 백업 데이터 최적화 전략에 대해 알아봤으니, 이제 각 전략 사용 시 주요 고려 사항에 대해 살펴봅시다. 적절한 접근 방법을 선택하면 백업 데이터 스토리지 비용을 낮게 유지하면서 신속하게 데이터를 복구할 수 있습니다. 


- 티어별 스토리지 구현

백업의 데이터 보존 요구사항을 가장 비용 효율적인 스토리지 티어와 맞추는 것이 좋습니다. 사용 중인 클라우드 업체가 제공하는 티어의 수, 티어별 가격 차이, 첫 바이트 지연을 알아보십시오. 그런 다음 백업 데이터 집합의 워크로드 및 운영 데이터와 연결하십시오. 


티어별 스토리지의 이점을 극대화하려면 정해 둔 정책에 따라 데이터가 티어 사이를 이동해야 합니다. 예를 들어, 6개월 전의 백업을 가장 가격이 비싼 클라우드 스토리지에 보존할 필요는 없습니다. 클라우드 업체가 스토리지 관리 기능을 제공하기도 하고 일부 엔터프라이즈 백업 솔루션에는 티어별 스토리지 관리 기능이 포함돼 있습니다. 또한 온프레미스 백업과 클라우드 백업을 ‘티어링’할 수도 있습니다. 가장 최근 백업은 가장 빠른 복구를 위해 온프레미스에 유지하고(대상이 온프레미스 워크로드라면), 오래된 백업은 클라우드 기반 스토리지로 티어링, 즉 옮길 수 있습니다. 


- 데이터 중복 제거 사용

일부 백업 솔루션은 데이터 중복 제거 기능을 포함하거나 애드온으로 제공할 수 있지만, 이런 옵션에는 제한이 있습니다. 가령 백업이 VM 수준에서 중복 제거를 수행한다고 했을 때 최선의 시나리오는 100개의 서버 모두를 동일한 기본 이미지를 사용해 구축하는 경우입니다. 이런 상황에서는 이들 서버 간의 모든 공통성에 막대한 중복 제거 기회가 있을 것입니다. 그러나 실제 이런 사례는 거의 없으므로 문서를 잘 보고 내장된 중복 제거 기능이 어느 수준에서 작동하는지, 실제로 어떤 혜택을 제공할지를 파악하십시오. 


중복 제거 기능이 있다면 활용해야 하지만, 백업 및 복구 성능에 부정적인 영향을 미치지 않는다는 전제하에서 사용해야 합니다. 


- 데이터 압축

백업 및 복구 솔루션의 압축 기능을 사용할 때 유의해야 할 점은 CPU 사용량이 상당히 높아질 수 있다는 것입니다. 또한 압축을 하더라도 최선의 결과를 산출하지는 못할 수 있습니다. 일부 백업 솔루션의 경우 압축률을 겨우 10% 높이는 데 CPU 사용량이 10배 증가하기도 합니다. 압축은 여전히 중요하지만, 백업 솔루션 기반 압축으로는 현재 달성할 수 있는 혜택을 모두 얻지 못할 수 있음을 유의하십시오. 


3가지 전략을 활용해 최상의 결과 달성

스토리지 비용을 비약적으로 줄이고 백업 및 복구 속도를 높일 방법을 찾는다면 최선의 방법은 3가지 데이터 최적화 방법을 모두 구현하는 것입니다. 어려운 부분은 기존 백업 솔루션과 원활하게 연계하며 압축과 중복 제거, 스토리지 관리를 처리하는 전략을 찾는 것입니다. 이런 접근 방법은 백업 및 복구 작업의 효율성과 정확성을 극대화합니다. 서드파티 전략에 투자하면 백업 솔루션에 오버헤드를 더하지 않아도 되고 신속하게 그 효과를 얻어 스토리지 비용 절감을 실현할 수 있습니다. 적절한 전략이라면 데이터 최적화에 도움이 될 뿐만 아니라 랜섬웨어에서 보호할 수 있는 변경 불가 백업도 제공해야 합니다. 


데이터 최적화를 향한 길

앞으로 데이터는 계속 증가하고 그에 따라 백업 및 복구 작업의 부담은 커질 수밖에 없습니다. 조직이 클라우드 스토리지에 대해 무제한의 예산을 두는 경우는 결코 없으므로 IT 부서는 백업과 복구 속도를 높이면서 그 결과로 생성된 백업 데이터를 클라우드에 보존/유지하는 비용을 낮춰주는 데이터 최적화 방법에 투자해야 합니다. 데이터 중복 제거, 데이터 압축 및 티어별 스토리지를 사용해 백업을 최적화한다면 스토리지 비용을 낮추고 백업 및 복구 속도를 높일 수 있을 것입니다. 


데이터 백업 혹은 백업 데이터 관리에 대해 궁금한 점이 있으시면 언제든 퀘스트소프트웨어 코리아로 문의주시기 바랍니다.




퀘스트소프트웨어코리아(주)

서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600

전자 메일 KoreaMarketing@quest.com 


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB


퀘스트소프트웨어코리아(주) 서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600 | 전자 메일 KoreaMarketing@quest.com


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB