자료실

스토리지 계층화가 백업 전략에 필수인 이유


Quick Overview 

데이터를 중요성과 가치에 따라 적절한 저장소에 배치하는 클라우드 스토리지 계층화는 기업의 백업 데이터 관리 전략에 필수적입니다. 스토리지 계층화가 기업에 주는 이점은 무엇일까요? 여기서는 백업 데이터 계층화가 왜 중요한지, 계층화 전략을 수립할 때 중요하게 고려해야 하는 점은 무엇인지 알아봅니다.


데이터는 중요합니다. 데이터는 비즈니스의 생명소이며, 데이터를 사용할 수 없게 되면 비즈니스는 막대한 타격을 받습니다. 그러나 모든 데이터의 가치가 동일하지는 않습니다. 데이터의 수명주기를 살펴볼 때는 무엇을 어떻게 보호하고 그 데이터를 어디에 보관할지를 검토해야 합니다.  

  

이번 포스팅에서는 클라우드의 다양한 계층을 사용한 데이터 저장, 즉 클라우드 ‘계층화(storage tiering)’에 대해 살펴보고 백업 데이터의 계층별 저장이 주는 이점과 그에 따른 비용을 알아봅니다. 기업의 데이터 보호를 책임지는 백업 관리자라면 이 글을 통해 자체 IT 환경에서 스토리지 계층화를 적용할 수 있는 가능성을 평가해 보시기 바랍니다. 

  


스토리지 계층화란 무엇이고 어떻게 작동할까요? 

스토리지 계층화는 변경 또는 액세스될 가능성이 낮은 특정 백업 데이터를 저비용 스토리지(일반적으로 클라우드에 위치)로 옮기는 방식입니다. 스토리지 계층화를 사용하면 백업 데이터의 장기 보존이 가능하고 백업 시스템 관점에서 데이터 복구가 투명하게 이뤄지며, 비용도 절감할 수 있습니다. 또한 자동화를 통해 수동 개입을 거의 하지 않고 이런 모든 혜택을 누릴 수 있습니다. 

  

대부분 기업에서 스토리지 계층화는 오래된 데이터에 더 저렴한 스토리지 구조를 사용하는 방법으로 간주됩니다. 데이터가 오래될수록 그 데이터 변경이나 액세스 가능성은 낮아집니다. 그러나 오래된 데이터도 규정을 준수하거나 감사에 대비하기 위해 여러 해 동안 보관해야 합니다. 스토리지 계층화를 사용하면 데이터가 오래될수록 점진적으로 더 저렴한 저성능 미디어로 옮길 수 있습니다. 이를 통해 로컬 고속 백업 스토리지의 공간을 확보해서 더 빠른 복구를 위해 액세스할 수 있는 최근 데이터를 저장하는 데 사용할 수 있습니다. 

 

데이터 계층을 잘못 선택할 경우 비용이 발생하므로 균형을 잘 잡아야 합니다. 3년 동안 아무도 액세스하지 않은 고속 스토리지 백업 데이터를 그대로 둘 경우 용량 측면에서 비용이 발생합니다. 반대로, 오래되고 계층화된 데이터에서 복원해야 하는 경우 이그레스 비용과 함께 느린 데이터 회수에 따른 시간적 불이익이 발생합니다. 


이런 이유로 스토리지 계층화는 백업 데이터를 다음 계층으로 옮기는 시간 기준이 너무 이르지도, 너무 늦지도 않도록 지속적으로 이뤄지는 작업입니다. 타이밍을 완벽하게 맞출 수는 없지만 부정확한 예측을 최소한으로 줄이는 데 목표를 두어야 합니다. 너무 많은 데이터가 너무 빠르게 저비용 미디어로 이동되어 느린 회수 속도로 인해 복구 시간 목표가 영향을 받는, 균형이 맞지 않는 스토리지는 피해야 합니다. 


스토리지 계층화 이니셔티브를 시작하면 어느 백업 데이터 집합을 언제, 어디로, 왜 옮기는지에 대한 정책을 구성할 때 사람이 개입하게 되지만 시간이 지나면 자동화에 따라 데이터 계층 이동이 이뤄져야 합니다. 

  


어떤 데이터를 어디에 저장할지 결정하는 기준은 무엇일까요? 

계층화할 데이터 집합을 어떻게 분류해야 할까요? 데이터베이스, 가상머신, 파일, 폴더와 같은 백업 데이터 유형에 따라 결정할까요? 아니면 7년 데이터 보존 요구사항과 같은 규정, 또는 유형과 규정 준수 2가지의 조합에 따라 결정할까요? 

  

데이터를 복원해야 한다면, 대부분 경우 1개월 이내에 생성된 데이터를 복원해야 할 가능성이 높습니다. 그러나 이 데이터도 1개월을 넘어 예를 들어 6년 11개월 동안 추가로 보관해야 하므로 시간이 지나면서 저장 비용을 낮출 방법을 모색하게 됩니다. 그렇게 해서 최근 30일 동안의 데이터를 로컬에 저장하는 정책을 수립하고, 오래된 데이터를 온프레미스 스토리지 또는 클라우드의 다른 저렴한 곳으로 옮기기 위한 계층화 정책을 마련할 수 있습니다. 

  

넓게 보면 스토리지를 다음과 같은 몇 개의 계층으로 나눌 수 있습니다. 

  


  1. 핫 스토리지는 솔리드 스테이트 드라이브(Solid State Drive, SSD), 스토리지 영역 네트워크(Storage Area Network, SAN) 또는 비휘발성 메모리 익스프레스(Non-Volatile Memory Express, NVMe) 카드와 같은 미션 크리티컬 고성능 미디어입니다. 이런 미디어는 CPU 가까이, 가급적이면 CPU와 동일한 버스에 배치됩니다. 핫 스토리지는 데이터베이스에 이상적입니다. 

  2. 웜 스토리지에는 직접 연결된 회전 디스크와 같은 미디어가 포함됩니다. 

  3. 콜드 스토리지는 일반적으로 클라우드 또는 테이프를 의미합니다. 즉, 복구해야 할 가능성이 가장 낮고 긴 회수 시간이 용인되는 데이터를 위한 미디어입니다. 


  

백업 데이터를 위한 계층화 전략의 주요 고려 사항 

 

용량 

위에서 언급했듯이, 예측을 잘못해서 최근 데이터를 오래되고 느린 계층에서 복원해야 하는 상황에 처할 수 있습니다. 한 번에 얼만큼의 데이터를 복원해야 하는지를 고려하십시오. 그 용량을 위한 공간이 충분히 있습니까?

  

파손 

스토리지 계층화 시스템의 일부가 파손된 경우를 가정해 보겠습니다. 테이프가 손상되거나 로컬 백업 스토리지가 랜섬웨어의 공격에 당한 경우 어떻게 될까요? 파손되지 않은 다른 부분에 남아 있지만 사실상 고립된 다른 데이터는 어떻게 되나요? 이 데이터를 어떻게 살릴 수 있을까요? 필수 보존 기간 중 어느 시점에 감사를 받는다면 “데이터가 저기 있는데 접근은 할 수 없습니다”라는 말은 감사관에게 통하지 않습니다. 

  

미디어 

저성능 미디어라 해도 고성능 미디어의 일부 기본적인 동작은 공유해야 합니다. 모든 계층에서 데이터 구조는 자체적인 설명이 가능한가요? 미디어 다시 연결하기, 데이터 회수, 인덱스 생성하기와 같은 일반적인 작업을 수행할 수 있나요? 


투자 

물론 7년 치의 데이터를 콜드 계층에 보관하면 웜 계층에 보관하는 경우에 비해 비용이 훨씬 덜 듭니다. 그렇게 절감한 비용을 어디에 투자할 계획인가요? 데이터가 콜드 계층으로 이동되면 핫 계층을 더 개선하는 데 사용할 수 있는 여유 자금이 생기는 셈입니다. 예를 들어 더 많은 용량, 더 빠른 속도의 스토리지 미디어를 추가할 수 있습니다. 스토리지 계층화의 이점 중 하나는 프로덕션 환경의 사용자와 고객을 위한 성능 개선에 투자할 수 있다는 것입니다. 이를 통해 데이터의 위치에 따라 계층화 구조의 비용 균형을 맞출 수 있습니다. 


예산 

데이터 분류, 옮길 대상에 대한 정책 의사 결정 외에 스토리지 계층화의 비용 편익 요소도 있습니다. 잘못된 유형의 데이터를 잘못된 위치에 보관할 경우 어느 정도의 비용이 발생할까요? 적절한 데이터를 적절한 위치에 보관할 때 얻는 이점은 무엇일까요? 이런 질문에 대한 답은 정량화할 수 있으며, 예산에도 영향을 미칩니다. 


  

SLA(Service-level agreement) 

클라우드 스토리지와 같은 서비스 제공업체는 일반적으로 서비스 수준 계약(Service-level Agreement, SLA)를 제공하지만 잘 관찰해야 할 중요한 세부 사항이 있습니다. 대부분 제공업체는 업타임 백분율로 측정되는 회복탄력성에 대한 SLA를 제공하는데(예를 들어 99.999%, 또는 ‘9x5’) 이는 인프라와 접근성을 가리킬 뿐 클라우드에 저장된 데이터의 중복성이나 백업 데이터 자체의 보호까지 적용되지는 않습니다. 이 경우 클라우드 스토리지의 복제를 다른 지리적 영역으로 구성해야 합니다. 

 

 

회수 시간 

클라우드 스토리지가 등장하기 전에는 많은 기업이 백업 인프라 서버에 연결된 수백 개의 테이프가 포함된 방대한 라이브러리를 유지했습니다. 테이프에 있는 데이터를 복구하려면 복원 작업을 실행했습니다. 데이터센터의 어딘가에서 라이브러리의 로봇 팔이 활성화되어 적절한 테이프를 찾아 테이프 드라이브에 넣은 다음 원하는 데이터를 찾아서 복원하는 방식입니다. 이 작업에만 5~10분이 걸릴 수 있습니다. 

 

지금은 클라우드 스토리지에서 데이터 집합 복구를 시작하기 위해 그만큼 기다려야 한다면 문제가 됩니다. 사용자의 높은 기대치와 인내심의 부족에 직면하면 여러분은 “스토리지 계층화의 이점은 여전히 원하지만 느린 회수 속도는 용납할 수 없다”라고 생각할 수 있습니다. 이 난제의 해결은 엔터프라이즈 백업 소프트웨어와 보조 스토리지 최적화를 위해 선택하는 툴에 따라 좌우됩니다. 

  


회수 비용 

클라우드 계층화를 위한 제품을 구매하기 위해 살펴볼 때 대부분의 IT 전문가는 월별 스토리지 비용에 초점을 둔 다음 여기에 저장하고자 하는 데이터의 양을 곱합니다. 이는 처음 시작할 때는 추천할 만한 방법이지만 다음과 같은 다른 불가피한 비용도 있습니다. 


  1. GB당 데이터 회수 비용 

  2. 1,000회 쓰기 요청당 비용 

  3. GB당 네트워크 비용(인바운드) 

  4. GB당 네트워크 비용(아웃바운드), 또는 이그레스 비용  


이그레스 비용은 특히 치명적입니다. 큼지막한 글씨로 “사용한 만큼만 비용을 내세요”라고 쓰여 있지만, 작은 글씨로 된 부분에 주의를 기울여야 합니다. 클라우드 스토리지 제공업체에 따라 특정 월에 저장한 데이터의 양보다 더 많은 데이터를 회수하면 그 초과분에 대한 비용을 청구하기도 하고, 이그레스 데이터에 대해서만 비용을 청구하기도 합니다. 

  


중복 제거 

데이터를 분류하고 스토리지 계층 구조의 어느 부분에 저장할지 결정한 이후에도 저장하는 데이터를 최적화하는 것이 좋습니다. 데이터 집합을 최적화하는 기술을 사용하여 웜/콜드 스토리지의 절감 효과를 결합해 비용을 더욱 아낄 수 있습니다. 


계층 간 이동하는 데이터의 양이 적을수록 저장과 전송에 들어가는 전체 비용은 낮아집니다. 중복 제거는 백업해서 네트워크를 통해 전송해야 하는 데이터의 양을 줄이기 위한 입증된 기술입니다. 중복 제거 소프트웨어는 알고리즘을 사용하여 데이터를 스캔해서 이미 저장된 블록을 제거하고 백업된 비슷한 데이터에 대한 포인터로 대체합니다. 이 포인터는 나중에 중복 제거된 데이터를 원상 복구하는 데 사용됩니다. 


스토리지로 전송하기에 앞서 백업되는 데이터의 양을 줄임으로써 처리량을 대폭 늘리고 데이터 이동 속도를 높일 수 있습니다. 온프레미스와 클라우드를 불문하고 중복 제거와 스토리지 계층화를 결합하면 비용을 낮추고 회수 시간을 단축하기 위한 기반이 됩니다. 

  


계층화된 스토리지의 이점 

주요 이점에는 다음이 포함됩니다. 

  

  1. 스토리지 비용 절감(위 설명 참조) 

  2. 아웃소싱 인프라(특히 클라우드를 선택하는 경우) 

  3. 스토리지 효율성(압축 및 중복 제거와 같은 기능을 갖춘 보조 스토리지 제품을 구현하는 경우) 

  4. 재해 복구 개선(일반적인 스토리지 구조의 외부에서 데이터를 보호. 예를 들어 클라우드 스토리지를 사용하는 경우 완전히 다른 오프사이트의 스토리지 구조가 됩니다. 단, 원본 소스를 제공하지 않아도 이 원격 사이트에서 데이터를 복구할 정도의 지능을 갖춘 계층화 시스템을 구현해야 합니다.)  

  5. 하이브리드 스토리지 패러다임. 클라우드 스토리지에 연결된 빠른 로컬 데이터 회수 기능. 스마트한 클라우드 계층화 제품은 로컬 스토리지를 클라우드로 확장해서 데이터 집합을 더 지능적으로 사용할 수 있게 해줍니다.


또한 높은 성능이 필요 없는 하위 계층을 위한 오래되고 느린 장비의 용도 변경이라는 측면도 있습니다. 벤더가 여전히 그 장비를 지원하고 있나요? 유효 수명이 얼마나 남았나요? 이 범주의 하드웨어에 데이터 보호와 무결성을 맡길 경우 위험 요소가 추가됩니다. 

  


결론 

스토리지 계층화의 핵심은 모든 백업 데이터를 값비싼 고속 미디어에 보관할 필요는 없다는 점입니다. 데이터가 오래될수록 누군가가 그 데이터를 복구하기를 원할 가능성은 줄어듭니다. 스토리지를 위한 수많은 옵션이 제공되는 지금 시대에 현명한 IT 전문가라면 스토리지 계층화와 점진적으로 더 저렴한 계층으로, 자동으로 데이터를 옮겨주는 툴을 선택합니다. 일반적으로 스토리지의 온도가 낮을수록 데이터에 액세스해야 할 때 그 데이터를 회수하는 시간은 오래 걸리지만 보조 스토리지 툴을 사용하면 도움이 됩니다. 성공적인 스토리지 계층화는 데이터를 보존하는 데 지출할 비용과 그 데이터를 복구하는 동안 기다릴 시간 사이에서 균형을 맞춥니다. 

  

계층화된 스토리지에 대한 이상적인 접근 방법에는 온프레미스와 클라우드를 불문하고 온도가 더 높은 계층이나 낮은 계층으로 프로그램에 따라 데이터를 옮기는 하이브리드 툴을 사용하는 것이 포함됩니다. 이러한 툴은 또한 초기 구성 후에는 완전한 자동화를 통해 수동 개입이나 지속적인 사람의 작업이 없이 데이터를 옮길 수 있습니다. 


  

스토리지 계층화에 어려움을 겪고 계시거나 관련 솔루션에 대해 궁금한 점이 있으시면 언제든 퀘스트소프트웨어코리아로 문의주시기 바랍니다.





퀘스트소프트웨어코리아(주)

서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600

전자 메일 KoreaMarketing@quest.com 


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB


퀘스트소프트웨어코리아(주) 서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600 | 전자 메일 KoreaMarketing@quest.com


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB