본문 바로가기 주메뉴 바로가기

최신IT소식

클라우드 백업의 낭패 : 예상치 못한 데이터 이그레스 비용

관리자 2020-06-17 조회수 50


 

클라우드 백업의 낭패 : 예상치 못한 데이터 이그레스 비용


회사 백업의 크기가 늘면 클라우드 백업을 고려하곤 합니다. 클라우드 스토리지에 바로 저장하면 스토리지 공간에 대해 걱정할 필요가 없다는 것이 주된 이유일 것입니다.

 

실제로 클라우드 스토리지의 용량은 거의 무한대입니다. 또한, 클라우드 티어링을 활용하면 장기 백업 데이터를 네트워크-인 비용 없이 기가바이트당 매우 저렴한 월요금으로 저장할 수 있습니다. 테이프 드라이브와 물리적 미디어를 사용하는 것에 비해 월등히 유리합니다.

 

그렇다면 무엇이 문제일까요?

 

“2016년 데이터를 가져오려면, 돈을 내세요!”

숨은 문제는 백업 데이터를 클라우드 스토리지로 보낼 때 발생하는 비용과, 나중에 다시 가지고 올 때 발생하는 비용이 완전 별개라는 것입니다.

 

클라우드에 저장하고자 하는 데이터 양이 어느 정도인가요? NASA의 ESDIS(Earth Science Data and Information System) 프로그램은 5년간 무려 247페타바이트를 저장했다고 하는데, 아마 여러분의 회사는 이정도는 아닐 것입니다. NASA는 이 데이터를 AWS로 보낼 계획입니다. 비용 효율적이고 현명한 선택입니다.

 

NASA는 모든 인프라를 직접 관리할 필요가 없게 됩니다. AWS의 클라우드 티어링에는 S3 Standard, S3 Standard Infrequent, S3 Glacier 및 S3 Deep Glacier Archive 서비스 수준이 포함됩니다.

 

문제는 NASA가 연구원과 상용 사용자도 이 데이터에 액세스하도록 허용할 계획이라는 점입니다. 이는 클라우드 이그레스(egress) 즉, AWS에서 내부로 데이터를 다시 불러오는 것을 의미합니다. 기가바이트당 이그레스 비용은 회수(retrieval)의 경우 0.035달러, 네트워크-아웃 비용은 최대 0.09 달러입니다.

 

감사 결과, NASA와 AWS의 연간 6,500만 달러 계약 외에, 이그레스 비용으로 2025년까지 매년 3,000만 달러가 추가로 소요될 수 있는 것으로 나타났습니다.

 

데이터 이그레스 비용의 역습

이 사례의 교훈은 클라우드 백업 비용을 모델링하면서, ‘사용자가 이 데이터에 언제, 얼마나 자주 액세스할 것인가?’를 자문해야 한다는 것입니다.

 

액세스 가능성이 높은 경우, 예를 들어, 지난 화요일의 백업이라면 온프레미스 데이터센터에 두거나 표준 클라우드 스토리지 티어에 저장합니다.

액세스 가능성이 낮은 경우, 예를 들어 컴플라이언스를 위해 7년 동안 보관해야 하는 환자 데이터라면 2년 후 클라우드 스토리지의 저렴한 아카이브 티어에 저장합니다.

 

아래 표는 AWS와 마이크로소프트 애저가 제공하는 다양한 티어의 클라우드 백업 비용을 간단히 요약한 것입니다(2019년 11월 기준).

 

 

Azure Archive와 Amazon Deep Archive 클라우드 티어는 기가바이트당 스토리지 비용이 더 저렴하지만, 트랜잭션당 비용은 더 높고, 첫 바이트까지의 시간(TtFB)이 더 깁니다. 세상만사에는 항상 대가가 따르는 법입니다.

 

중복제거로 클라우드로 전송되는 데이터 양 줄이기

NASA도 그렇겠지만, 여러분도 클라우드에서 백업을 복원하는 데 따르는 이그레스 비용이 걱정일 것입니다. 처음부터 클라우드로 전송되는 데이터를 줄이려면 어떻게 해야 할까요?

 

답은 중복제거, 특히 백업에 앞선 가변 길이 소스 측 중복제거와 데이터 압축입니다. 클라우드로 옮기는 데이터가 적을수록 데이터를 저장하고 전송하는 전체 비용은 낮아집니다.

 

중복제거는 알고리즘을 사용해서 데이터를 스캔하고 이미 저장된 모든 요소를 제거하고 비슷한 백업된 데이터를 가리키는 포인터로 대체합니다. 결과적으로 클라우드에서 송수신되는 데이터의 양이 줄어들고, 데이터 전송 속도는 더 빨라집니다.

 

[참고 : 데이터 중복제거란 무엇인가?]

 

압축, 중복제거와 함께 클라우드 제공업체가 제공하는 핫 티어/콜드 티어를 전략적으로 혼합해 사용하면 전체적인 비용을 낮추면서 TtFB를 단축하는, 두 가지 장점을 모두 취할 수 있습니다.

 

물론, 클라우드는 잘 보호되므로 백업을 저장하기에 좋습니다. 그러나 결정할 때 이그레스 비용을 모델에 반영하는 것을 잊지 말아야 합니다.

 

핫 티어와 콜드 티어 선택 방법, 아카이브와 딥 아카이브 중에서의 선택 방법 등 클라우드 백업과 관련해 궁금한 점이 있으시다면, 언제든 퀘스트소프트웨어로 문의 주시기 바랍니다.

 

 

  • 등록된 댓글이 없습니다.