본문 바로가기 주메뉴 바로가기

최신IT소식

데이터 복제란 무엇인가? 데이터 복제의 장점은?

관리자 2020-11-18 조회수 43

 
 

데이터 복제란 무엇인가? 데이터 복제의 장점은?

 

데이터 복제는 데이터의 복사본을 여러 장소에 동시에 업데이트하는 과정입니다. 복제의 목표는 데이터에 의존해 의사 결정을 내리는 사용자와 거래에 데이터가 필요한 고객을 위해 데이터의 가용성을 유지하는 것입니다.

 

데이터 복제가 이뤄지는 방법은 소스와 타겟 데이터를 동기화된 상태로 유지하는 것입니다. 이는 소스 데이터에 적용되는 모든 변경 사항이 타겟 데이터에 정확하고 신속하게 반영됨을 의미합니다.

 

데이터 복제 전략에 따라 타겟 데이터베이스는 소스와 동일할 수도 있고(전체 데이터베이스 복제) 타겟이 소스의 하위 집합일 수도 있습니다(부분 복제). 고가용성이나 재해 복구에 목표를 둔다면 전체 복제본을 유지하는 편이 합리적입니다. 분석과 보고 용도라면, 데이터베이스의 하위 집합(지역 또는 부서에 따름)만 타겟에 복제하는 방법으로 소스 데이터베이스에 가해지는 워크로드를 줄일 수 있습니다.

 

데이터 복제의 예

데이터에 대한 의존이 커질수록 단일 실패 지점 방지의 중요성도 함께 높아집니다. 프로덕션 소스에서 다른 도시 또는 시간대의 타겟으로 데이터를 복제할 때 사용자와 고객이 항상 이 데이터에 액세스할 수 있도록 보장해야 합니다.

 

IT 관리자는 재해 복구를 위해 데이터 복제를 선택하는 경우가 많습니다. 데이터가 서로 다른 2~3곳의 장소에 안전하게 유지되므로 한 장소에서 시스템 침해나 재해가 발생하더라도 비즈니스 중단 위험을 낮출 수 있습니다. 또한, 복제본은 항상 최신 상태이므로 비활성화된 소스의 트래픽을 타겟 사이트로 리디렉션하는 것만으로 비즈니스 연속성을 달성할 수 있습니다.

고객 기반과 개발 팀이 세계 곳곳에 위치하는 시대인 지금, 지리적으로 분산된 데이터베이스 복제본은 데이터가 필요한 사람들 가까이에 데이터를 둘 수 있게 해줍니다. 데이터 복제는 네트워크 지연을 극복하고 로컬 액세스를 개선하기 위한 유용한 전략입니다.

실시간 분석은 경쟁 우위에 있어 필수적입니다. 사업부 관리자는 쿼리를 실행하고 현재 트랜잭션을 근거로 의사 결정을 내리고자 합니다. 이러한 쿼리가 소스에 부담을 가하지 않도록 하기 위해 관리자는 분석가가 사용할 복제본을 만들어 유지하고, 이 작업을 프로덕션 데이터베이스에서 덜어냅니다.

 

아래 이미지는 로그 기반 복제 아키텍처로, 데이터가 소스에서 타겟, 그리고 클라우드로 흐르는 모습을 보여줍니다.



 

데이터 복제가 중요한 이유

데이터 복제 기술은 조직에서 데이터베이스를 2곳, 5곳 또는 십여 곳에서 동시에 사용할 수 있게 해줍니다.

 

복제가 중요한 이유는 무엇일까요? ▲분석과 보고, ▲업그레이드 및 마이그레이션, ▲고가용성과 재해 복구 등 3가지 주요 영역에서 데이터를 유리하게 복제하는 방법을 살펴보겠습니다.

 

분석과 보고

어쩌면 “복제는 그다지 중요하지 않다. 데이터 파일을 20명에게 이메일로 보내기만 하면 20곳에 동시에 데이터를 둘 수 있다”라고 주장할 수도 있습니다.

 

사실입니다. 그러나 전자상거래 사이트의 끊임없이 변화하는 데이터 또는 회사의 소셜 미디어를 기반으로 하는 실시간 데이터라면 어떨까요? 이메일 수신자가 데이터 파일을 열어 분석을 시작할 시점이면, 이미 그 데이터는 과거의 데이터가 되어 있을 것입니다. 이것은 인쇄 신문을 읽는 것과 같습니다. 파일의 데이터를 오래 연구하면 할수록 내용은 점점 더 오래됩니다. 이 경우 새로운 또는 변경된 트랜잭션이 발생할 때마다 업데이트된 파일을 보내야 할 것입니다.

 

그 외에도 데이터 파일을 보내는 방법은 확장성도 좋지 않습니다. 100KB나 700KB 크기의 데이터 스프레드시트 정도라면 괜찮지만, 500GB 데이터베이스라면? 이 정도 크기의 파일을 매시간 전송할 수는 없습니다.

 

물론 “그런 경우에는 모든 사람이 프로덕션 데이터베이스에 로그인해서 쿼리하도록 하면 된다. 그러면 모두가 동일한 시간에, 정확히 동일한 데이터를 쿼리하고 분석할 수 있다”라고 반론을 제기할 수 있습니다.

 

맞는 말입니다. 그렇게 하면 오래된 데이터를 다루는 상황은 막을 수 있습니다.

 

하지만 그 대가로 데이터베이스 혼잡 문제가 발생합니다. 여러분이 실행한 보고서는 다른 모든 분석가가 실행 중인 보고서와 메모리 및 CPU 사이클을 두고 경합을 벌이게 됩니다. 또한, 모든 보고서는 회사의 운영 기반인 고객 트랜잭션과도 경합합니다.

 

데이터 복제는 근실시간 데이터를 분석가에게 제공해 조치를 취할 수 있도록 하는 더 효율적이고 매끄러운 방법입니다.

 

▲업그레이드와 마이그레이션

IT 관리자가 마이그레이션 또는 업그레이드를 수행하려고 하는 데이터 센터에서는 복제에 대한 논거가 다릅니다. 데이터 센터를 압박하는 요인은 보고서 실행이 아니라 비즈니스 연속성에 대한 요구입니다. 고객과 사용자는 마이그레이션이나 업그레이드가 진행되고 있는지 여부에 관심이 없습니다. 이들은 중단 없는 완전한 데이터 액세스를 원합니다.

 

“문제없다. 마이그레이션/업그레이드 중에는 데이터베이스를 백업해서 타겟에 복원하면 된다. 모든 데이터가 두 곳에 위치하게 되면 마이그레이션/업그레이드를 시작한다. 이후 작업이 완료되면 바로 모든 사용자를 새 환경으로 연결하면 된다”라고 말할 수 있습니다.

 

하지만 그 사이 변경되고 추가된 모든 트랜잭션은 어떻게 되는 걸까요? 새 환경을 이전 환경과 동기화하는 데는 꽤 오랜 시간이 걸립니다. 또한, 새 환경에 문제가 발생한다면 어떻게 할까요? 이전으로 롤백해서 다시 시도해야 합니다. 이것은 비즈니스 연속성이 아닌 비즈니스 단절을 유발합니다.

 

데이터 복제는 위험 없이 데이터베이스를 업그레이드 및 마이그레이션하기 위한 프로덕션 데이터의 정확한 실시간 복사본을 유지할 수 있게 해줍니다. 데이터 복제는 테스트가 완료되어 사용자를 새로운 업그레이드된 환경으로 안심하고 전환할 수 있게 될 때까지 소스와 타겟을 동기화된 상태로 유지합니다.
 

 



▲고가용성과 재해 복구

데이터베이스 관리자는 고가용성, 재해 복구 및 99.999%의 업타임을 주시하면서 데이터베이스가 매끄럽게 작동하도록 할 책임이 있습니다. 예정되지 않은 다운타임은 서비스, 데이터, 돈, 고객 손실로 이어지므로 여러 데이터베이스와 플랫폼의 효율적인 동작을 유지하는 것이 무엇보다 중요합니다. 고가용성은 사용자가 항상 데이터를 사용할 수 있도록 하며 재해 복구는 데이터를 사용할 수 없게 될 경우에 대비한 큰 안전 그물입니다.

 

“데이터베이스에 고가용성을 위한 네이티브 툴이 포함되어 있다”거나 “재해 복구를 위해 원격 복사본을 유지하는 다른 툴도 사용하고 있다. 이와 같은 방법으로 두 곳 이상에 데이터를 두고 있다”라고 주장할 수 있습니다.

 

네이티브 툴은 기능은 제한적인 반면 값은 비싼 경우가 많으며 여전히 단일 실패 지점인 공유 데이터베이스가 있는 경우도 일부 존재합니다. 이 데이터베이스에 장애가 발생하면 복구할 때까지 시스템이 다운됩니다. 그 외에도 복사와 복제는 다릅니다. 복사본은 스냅샷이고 데이터베이스의 스냅샷은 새로운 트랜잭션이 발생하는 순간 유효 기간이 끝납니다.

 

반면 복제본은 진정한 고가용성을 제공합니다. 복제는 장애 발생 시 즉시 대체할 수 있는 데이터베이스가 있음을 의미합니다.

 

데이터 복제를 실행하면 고가용성을 달성하고 재해 복구를 강화할 수 있습니다. 복제는 유지보수 또는 다운타임 중에 사용자를 예비 시스템으로 전환하여 프로덕션 데이터를 계속 사용하도록 할 수 있게 해줍니다. 애플리케이션은 전체 재해 복구 데이터베이스의 복사본을 가동할 때까지 기다릴 필요가 없고, 이는 손실되는 트랜잭션이 없음을 의미합니다. 또한 적절한 고가용성 제품을 사용하면 재해 복구에 동일한 타겟 데이터베이스를 사용할 수 있습니다.

 



두 곳 이상에서 사용 가능한 데이터

 

데이터베이스를 동시에 두 곳 이상에 둘 때 얻는 이점은 상상 이상으로 많습니다.

 

또 다른 예는 데이터 통합 프로젝트입니다. 여러 소스로부터 대량의 데이터를 끌어 모으는 경우 이러한 모든 소스에서 복제 타겟으로 데이터를 전송하면 프로덕션 데이터의 가용성을 유지할 수 있습니다. 통합 툴은 다양한 사일로의 데이터를 집계해서 운영 및 분석에 사용할 수 있게 해줍니다.

 

데이터 기반이 된다는 말은 사용자와 데이터베이스 사이의 장애물을 최대한 제거한다는 것을 의미합니다. 데이터 복제는 사용자의 필요에 따라 여러 곳에 데이터를 두기 위한 큰 진전입니다.

 

데이터 복제에 대해 궁금한 것이 있거나 계획 중이시라면, 언제든 퀘스트 소프트웨어 코리아로 문의 주시기 바랍니다.

 

 

  • 등록된 댓글이 없습니다.