본문 바로가기 주메뉴 바로가기

최신IT소식

“숫자에 속지 말자” 백업 워크로드에 대한 중복 제거 절감 효과 광고 제대로 이해하기

관리자 2018-01-17 조회수 7,192

GettyImages-648691990.jpg

“숫자에 속지 말자” 백업 워크로드에 대한
중복 제거 절감 효과 광고 제대로 이해하기



소프트웨어 및 하드웨어 중복 제거 어플라이언스에 대한 백업 솔루션 자료를 보면 대부분 “... 최대 20:1의 절감…” 또는 “...95%의 백업 용량 절감…”과 같은 광고 문구가 등장합니다.

이러한 광고에서 말하는 중복 제거 절감 값을 정확히 이해하지 않으면 잘못된 판단을 내릴 수 있습니다. 이 블로그의 목적은 광고에서 제시하는 수치를 이해하는 데 필요한 지식을 전달하고 중복 제거와 관련된 더 합리적인 의사 결정을 내리도록 돕는 것입니다.


중복 제거
중복 제거는 말 그대로 중복된 데이터를 제거하는 것입니다. 예를 들어, 수천 개의 문서에 회사 이름이 포함되어 있다고 가정해 봅시다. 일반적인 백업을 수행할 때 수천 개의 중복된 회사 이름은 하나의 사본에만 보관되므로 백업 저장 공간을 대폭 절약할 수 있습니다. 중복 제거 기능은 이후 백업이 보존될 때마다 이미 저장된, 즉 중복된 데이터를 계속 지웁니다.

중복 제거는 현재 백업과 새로운 백업 환경에서 예를 들어 1) 백업 스토리지 하드웨어 투자 비용 저감, 2) 백업 성능 향상, 3) 데이터 센터 공간 절약, 4) 전력 및 냉각 사용량 감소, 5) 관리할 대상 감소와 같은 여러 가지 비용 절감 효과를 더해줍니다. 중복 제거의 절감 효과가 높을수록 위에 언급한 중복 제거의 혜택도 커집니다.


중복 제거 절감 효과 계산하기
광고의 중복 제거 절감 효과를 이해하기 위한 첫 번째 단계는 중복 제거 절감 효과를 계산하는 방법을 아는 것입니다.


중복 제거 측정은 간단합니다.

1. 중복 제거 기기에 흡수되는 데이터의 크기(X) 측정

2. 중복 제거 기기에 보존되는 데이터의 크기(Y) 측정

3. 이 데이터를 근거로 비율 혹은 백분률(%) 형태로 중복 제거 절감 효과 표기


참고 : 중복 제거 기기는 하드웨어와 소프트웨어 중복 제거 상품을 모두 의미할 수 있습니다. 예를 들어, 퀘스트 DR 시리즈 어플라이언스, 델 EMC Data Domain, HP StoreOnce 기기와 같은 하드웨어 기반 디스크 백업 어플라이언스가 많이 사용됩니다. 백업 소프트웨어 제품에는 CommVault, Veeam 또는 퀘스트 래피드 리커버리(Rapid Recovery)와 같이 기본 중복 제거 옵션이 포함되느 경우가 많습니다. 따라서 중복 제거 기기는 소프트웨어 솔루션을 나타낼 수도 있습니다. 이 블로그의 내용은 주 스토리지 솔루션 내에 존재하는 중복 제거에도 적용되지만, 여기서는 백업 워크로드에 초점을 두고 살펴보겠습니다

비율
예를 들어, 20GB의 백업 데이터가 중복 제거 기기로 흡수되고(X=20) 중복 제거 어플라이언스의 디스크에 보존되는 고유한 백업 데이터의 크기가 1GB에 불과하다면(Y=1) 중복 제거 벤더는 20:1의 절감비 혹은 20배의 절감 효과라고 광고할 것입니다.

백분율
중복 제거 절감 효과는 백분율로 표시할 수도 있습니다. 20:1 절감비의 백분율 값을 구하는 방법은 다음과 같습니다.

1. 중복 제거로 절감한 크기를 확인합니다. 여기의 예에서는 20-1=19GB의 데이터를 절감했습니다.

2. 절감된 크기를 처음 백업 크기로 나눕니다. 이 예에서는 19/20=95%가 됩니다.

따라서, 20:1의 절감비는 95%의 절감 백분율과 같습니다.

40:1의 절감은 20:1에 비해 두 배 더 좋을까?

주의하지 않으면 스토리지 절감비의 착시 효과에 빠지기 쉽습니다. 비율 값을 해당하는 백분율료 변환하는 편이 이해하기에 좋습니다

- 40:1 절감비를 절감 백분율로 환산하면 97.5%

- 20:1 절감비를 절감 백분율로 환산하면 95.0%


보시다시피 40:1과 20:1의 절감 효과 차이는 두 배가 아니라 아주 미미합니다.


몇 개의 복사본이 적합할까?
여기부터 까다롭습니다. 중복 제거 기기에 흡수되는 첫 번째 백업 세트에서 95%의 중복 제거 효과를 기대하지 마십시오. 두 번째 또는 세 번째 백업도 마찬가지입니다. 이유가 무엇일까요? 첫 번째 백업이 중복 제거 솔루션에 흡수되면 그 데이터는 대부분 고유한 데이터이므로 중복 제거 절감 효과도 낮습니다.

두 번째 백업이 흡수되면 첫 번째 데이터와 중복되는 데이터가 발견되겠지만 마찬가지로 95%의 스토리지 절감 효과를 기대할 수는 없습니다. 왜일까요? 최선의 중복 제거 시나리오, 즉 이전 백업에서 변경된 점이 전혀 없는 경우를 가정하고 살펴봅시다. 이 경우 두 번째 백업 데이터 전체가 중복되므로 중복 제거를 통해 총 50%의 절감 효과를 거두게 됩니다.

계산:
입력 : 백업 2개

출력 : 백업 1개

총 절감 : 2:1 또는 50%


참고 : 주별 백업에는 일반적으로 10%의 데이터 변경이 포함됩니다. 새로운 데이터는 대부분 새로운 고유한 데이터이므로 50%보다는 ~45% 정도의 절감을 기대할 수 있습니다.

입력 : 백업 2개

출력 : 백업 1.1개

총 절감 : 2:1.1 또는 45%


세 번째 백업이 흡수되면 최상의 시나리오에서 중복 제거 솔루션의 총 절감 효과는 ~67%가 됩니다.

계산:

입력 : 백업 3개

출력 : 백업 1개

총 절감 : 66.67%


중복 제거 기기에 더 많은 백업이 흡수될수록 중복 제거를 통한 절감 효과는 높아집니다. 이처럼 백업의 수가 중복 제거 솔루션의 스토리지 절감 효과에 큰 영향을 미치므로 중복 제거 솔루션 비교 시 반드시 이 점을 고려해야 합니다. 중요한 점은 중복 제거 솔루션의 효과를 정확히 파악하려면 광고되는 절감 효과를 달성하기 위한 데이터(또는 백업)의 복사본 수를 알아야 한다는 것입니다.

중복 제거 솔루션 벤더는 중복 제거 절감 효과를 달성하는데 사용된 복사본의 수를 공개하지 않으므로, 각 벤더의 중복 제거 효과를 비교하기란 거의 불가능합니다. 즉, 똑 같은 중복 제거 솔루션 벤더라도 복사본의 수를 변경하는 것만으로 광고 수치상의 중복 제거 절감 효과는 최상과 최하를 오갈 만큼 큰 폭으로 널뜁니다.

백업 워크로드를 위한 중복 제거 솔루션을 비교하는 방법은?
제가 드릴 수 있는 제안은 두 가지입니다.

1. 구현되는 중복 제거의 종류를 확인합니다. 다양한 유형의 워크로드에 다양한 종류의 중복 제거 알고리즘이 사용되지만 가변 블록 슬라이딩 윈도우 중복 제거 엔진은 백업 워크로드용으로 만들어져 최상의 절감 효과를 제공합니다.

참고 : 최근 이미지 기반 백업 소프트웨어 솔루션이 인기를 끌고 있습니다. 이러한 유형의 제품은 블록 수준에서 작동하므로 가변 블록 슬라이딩 윈도우 중복 제거 방식을 사용하지 못할 수도 있습니다. 이런 경우 고정 블록 중복 제거 방법이 차선책이 됩니다.

참고 2 : 백업 소프트웨어 솔루션은 일반적으로 고정 블록 중복 제거를 구현합니다. 단순한데다 필요한 컴퓨팅 리소스가 적기 때문입니다. 그러나 결과는 가변 블록 슬라이딩 윈도우에 미치지 못합니다. 퀘스트 DR 시리즈 어플라이언스와 같은 대부분의 백업 타깃 기기는 최선의 스토리지 절감뿐만 아니라 최적의 성능까지 감안한 적절한 양의 리소스를 효율적으로 사용하는 가변 블록 슬라이딩 윈도우 중복 제거 놀리를 사용합니다.


2. 중복 제거 절감 효과를 평가하는 두 번째이자 가장 좋은 방법은 자체 환경 내에서 테스트하는 것입니다. 자기만의 데이터와 보존 정책(복사본 수)을 사용해 가장 적합한 중복 제거 솔루션을 정확히 판단할 수 있습니다. 많은 백업 중복 제거 벤더는 모든 기능을 제공하는 무료 평가판 가상 머신을 제공하므로 손쉽게 다운로드해서 환경에 설치해 테스트하고 평가할 수 있습니다. 이러한 가상 머신은 하드웨어 제품과 동일한 중복 제거 절감 효과를 제공합니다. 백업 타깃 가상 머신인 퀘스트 DR2000v를 사용해 가변 블록 슬라이딩 윈도우 중복 제거를 테스트해보십시오.

압축
압축은 데이터를 표현하는 데 필요한 비트 수를 줄이는 다른 형태의 스토리지 절감 기술입니다. 중복 제거와 압축은 잘 어울리는 조합입니다. 일반적으로 중복 제거를 먼저 적용해서 중복된 데이터를 제거한 후 압축을 적용해서 절감 효과를 더 개선합니다.

위에 설명했듯이 중복 제거는 흡수되는 복사본의 수와 관련되므로 압축을 추가한다고 해서 중복 제거의 절감 효과가 바뀌지는 않습니다. 그보다 압축은 중복 제거 솔루션의 절감 효과를 더 빠르게 얻을 수 있게 해줍니다.

요약
백업을 위한 중복 제거를 고려할 때 광고의 중복 제거 절감 효과가 여러분의 환경에서 얻을 수 있는 스토리지 절감 효과를 그대로 반영하지는 않는다는 점을 유의해야 합니다. 데이터의 유형과 절감 가치를 달성하기 위해 필요한 복사본의 수를 완벽하게 파악할 수 있는 자체 백업 환경 내에서 중복 제거 솔루션을 테스트할 것을 적극 권장합니다. 이렇게 비교하면 백업에 필요한 최선의 중복 제거 의사 결정을 내리기 위한 정확한 정보를 얻을 수 있습니다.

[ 본 포스팅의 원문은 Understanding Advertised Deduplication Savings for Backup Workloads 에서 확인하실 수 있습니다. ]

 

 

  • 등록된 댓글이 없습니다.