본문 바로가기 주메뉴 바로가기

최신IT소식

2021년 전망 - 비즈니스 연속성을 위한 디지털 탄력성 구축

관리자 2021-01-20 조회수 161




2021년 전망 - 비즈니스 연속성을 위한 디지털 탄력성 구축
 

2021년 마이크로소프트 플랫폼 관리와 관련된 8가지 전망 중에서, 오늘은 클라우드 서비스 및 통신 중단으로 인해 최소한의 하이브리드 비즈니스 연속성 계획에 대한 관심이 다시금 촉발될 것이라는 내용에 대해 살펴보도록 하겠습니다.

 

가용성 문제는 새로운 오피스 365 기능이나 최신 사이버 공격 기법처럼 흥미진진한 주제는 아닙니다. 하지만 무척 중요한 문제이며, 특히 지금의 현실에서 조직이 지속적으로 비즈니스를 하는 데 있어 반드시 필요한 디지털 탄력성을 추구한다면 더욱 중요합니다.

 

도처에서 발생하는 서비스 중단


“죄송합니다. 현재 로그인이 되지 않습니다.”

“일시적인 오류가 발생했습니다. 다시 시도하십시오.”

 

작년 9월 28일 동부 표준시로 오후 5시 30분부터 전 세계 곳곳의 사람들이 현대판 블루스크린을 경험하기 시작했습니다. 팀즈(Teams) 같은 마이크로소프트365 솔루션은 물론, 서드파티 애플리케이션까지 애저 AD(Azure AD)에 인증을 의존하는 모든 애플리케이션에서 로그인을 시도할 때 이런 오류가 발생했습니다. 이 중단 사태는 무려 6시간 이상 지속됐습니다. 10월 1일에는 주로 유럽의 익스체인지(Exchange)와 아웃룩(Outlook) 사용자들이 문제를 겪었습니다.

 

마이크로소프트를 비난하는 것이 아닙니다. 사실 사용량 급증을 고려하면 마이크로소프트 정도 되니까 그 정도의 부하에서 그렇게 ‘적은’ 중단이 발생한 것입니다. 상당수의 다른 클라우드 서비스에서도 다운타임은 발생하고 있습니다. 지난 11월 25일에는 미국 동부 지역에서 AWS가 몇 시간 동안 중단이 발생해 기업 소프트웨어 애플리케이션부터 주요 퍼블리셔들까지 도처에서 영향을 받았습니다.

 

구글도 예외는 아닙니다. 특히 3월은 힘든 시기였습니다. 새로운 원격 학생과 교사가 가장 크게 의존하는 지메일, 구글 드라이브, 문서, 스프레드시트, 슬라이드, 행아웃, 채팅, 미팅 서비스가 다운됐습니다. 그 뒤에는 무려 14시간 동안 여러 구글 클라우드 플랫폼(Google Cloud Platform) 서비스에서 오류가 발생한 일도 있었습니다.

 

5월에는 어도비 크리에이티브 클라우드(Adobe Creative Cloud)가 거의 종일 다운됐었고, 그 사이 고객들은 클라우드 기반 도구를 사용하지 못하고 문서에도 액세스하지 못했습니다. 10월에도 비슷한 중단이 발생해 한 사용자가 이 때의 짜증나는 상황에 대해 유튜브 영상을 올리기도 했습니다.

 

6월에는 IBM 클라우드에서 심각한 중단이 발생해, 여러 웹사이트를 포함한 여러 IBM 고객이 운영 중단을 겪었습니다. 전설처럼 남은 줌(Zoom) 서비스 중단 문제도 있었습니다.

 

비즈니스에 치명적인 클라우드 서비스 중단

급한 마감을 앞두고 있을 때 위와 같은 오류가 반복해서 계속 발생한다고 상상해 보십시오. 개인에게도 충분히 골치 아픈 문제이지만, 조직의 관섬에서는 더욱 심각합니다. 교사는 학생을 지도할 수 없고, 디자인 팀은 작업을 할 수 없습니다. 팀 간에 커뮤니케이션과 협업이 되지 않아 여러 중요한 프로젝트가 지연됩니다.

 

게다가 고객은 자신이 경험하는 문제의 원인이 클라우드 서비스 제공업체에 있다는 점에서는 조금도 관심이 없습니다. 고객은 추수감사절 전날 아이로봇 룸바(iRobot Roomba) 진공청소기 앱이 동작하지 않고, 구독료를 내고도 워싱턴 포스트의 기사를 읽을 수 없다면, 아마존이나 마이크로소프트가 아닌 여러분을 비난합니다. 따라서 여러분의 브랜드 평판이 낮아지고 수익에 손실이 발생할 수 있습니다.

 

‘고가용성’의 의미?

가용성의 궁극적인 목표는 “9x5(99.999%)”입니다. 이 수치는 연간 서비스 중단이 평균 5분임을 의미합니다. 수십년 전 TDM PBX 전화 시스템과 같은 온프레미스 솔루션은 이 목표에 근접하게 작동했으며, 최상급 품질의 하드웨어, 예비 시스템과 같은 수단을 통해 9x4 이상을 달성하는 경우가 많았습니다.

 

그러나 클라우드에서는 훨씬 더 광범위한 요소가 서비스 가용성에 영향을 미칠 수 있습니다. 최근의 서비스 중단 원인은 잘못된 구성, 소프트웨어 버그, 대규모로 배포된 이후에 발견된 업데이트의 결함, 냉각 설비 문제, 트래픽 급증, 악의적 공격 등이 있고 그 외에도 많습니다. 현재 9x5 가용성을 보장하는 서비스 수준 계약(SLA)을 제공하는 클라우드 서비스는 거의 없을 것입니다. 예를 들어, IBM 클라우드와 AWS의 SLA는 모두 9x4에서 고객에게 크레딧을 제공하기 시작합니다. 아마존은 애저 AD 베이직 및 프리미엄 서비스에 대해 9x3의 가용성만 보장합니다.

 

또한 SLA에는 여러분이 기대에 미치지 못하는 경우가 많습니다. 예를 들어 2011년 4월에 아마존이 거의 4일 동안 중단됐지만, 이 사고도 아마존의 EC2 SLA 기준에 위배되지 않았습니다. EC2 SLA에서는 “지역 내에서 365일에 걸쳐 99.95% 서비스 가용성”만 보장했기 때문입니다.

 

2021년, 디지털 탄력성 구축하기 ?

이 모든 것이 2021년에 의미하는 바는 무엇일까요? 클라우드 서비스 중단이 갑자기 사라질 일은 없습니다. 사실 상황은 더 나빠질 수 있습니다. 물론 SLA를 주의 깊게 읽어봐야 하지만 SLA가 적용된다 해도 청구서상의 10% 크레딧은 서비스 다운타임이 여러분의 비즈니스에 야기하는 피해를 상쇄하기에는 턱없이 부족할 것입니다.

 

원격 근무 역시 계속됩니다. 코로나19 백신으로 부분적인 사무실 복귀가 가능해질 수 있지만 집에서(그리고 출장이 다시 시작될 경우 출장 중에도) 효과적으로 업무를 수행할 수 있도록 계속해서 적절한 기능을 제공해야 합니다. 사실 많은 기업이 다양한 지리적 위치에 소규모 허브를 두는 방안을 고려하고 있으며 이와 같은 허브에서 근무하는 사람들도 커뮤니케이션과 협업을 해야 합니다.

 

이와 같은 냉혹한 현실에서 성공하기 위한 필수 요소는 디지털 탄력성을 구축하는 것입니다. 디지털 탄력성은 모든 것을 그냥 클라우드로 옮기고 싶은 유혹에 저항하는 것을 의미합니다. 대신 조직은 클라우드 액세스 없이 운영하는 데 필요한 최소한의 데이터가 무엇인지 시간을 들여 신중하게 파악한 다음 디지털화 전략과 재해 복구 계획에 적절한 하이브리드 모델을 구현해 넣어야 합니다.

 

핵심 산업의 많은 기업은 이미 이와 같은 문제에 대한 심사숙고를 거쳤지만, 그 외의 조직은 지금처럼 많은 사용자가 재택 근무를 한 적이 없고 따라서 클라우드 중단이 이렇게 크게 다가온 적이 없었기 때문에 사고에서도 뒤쳐져 있습니다.

 

이 노력에는 각자의 IT 생태계에 대한 깊은 이해가 필요하며, 최대한 명확하고 체계적으로 하는 것이 좋습니다. 그러면 워크플로우와 다른 사용자 활동을 더 정확히 이해하고, 온프레미스 AD와 로컬 데이터 저장소를 유지하기 위한 기업 전략을 개발함으로써 비즈니스 연속성을 보장하기 위한 조치를 취할 수 있습니다. 또한 중단 중에도 작업을 지속할 수 있도록 로컬로 동기화할 데이터를 현명하게(그리고 법적으로 책임감 있게) 선택하는 방법에 대한 사용자 교육도 필요합니다. 

  • 등록된 댓글이 없습니다.