자료실

데이터 민주화란 무엇인가? 필요한 이유는?


데이터 민주화란 무엇인가? 필요한 이유는? 


데이터 민주화(data democratization)에 대한 정의를 찾아보면 다음과 같은 몇 가지 공통점을 볼 수 있습니다.


- 보편적인 사용자를 위한 디지털 정보 접근성 높이기

- 데이터를 이해하고 신속한 의사 결정을 내리기 위한 툴 제공

- IT 담당자의 개입 없이 비즈니스 사용자에게 정보 시스템 개방

- 조직을 ‘데이터 우선’ 조직으로 만들어 경쟁력 향상


‘자유’라는 말이 떠오르지 않나요? “권력을 민중에게(Power to the People)” 운동과 “디지털 트랜스포메이션” 테마가 만난 것 같습니다.


데이터 민주화의 목표는 비즈니스 사용자가 신속하게 데이터를 입수해서 빠르게 대응할 수 있도록 돕는 데 있습니다. 이와 같은 힘은 중요한 경쟁 우위이며, 모든 스마트 조직이 원합니다.


그러나 힘에는 책임이 따릅니다. 모든 스마트 조직이 사용자에게 데이터에 대한 접근성을 부여하면서 꼭 필요한 데이터에만 접근할 수 있도록 하는 이유입니다. 여기서 데이터 민주화의 정의가 하나 더 추가되는데, 이번에는 가드레일이 있습니다.


데이터 민주화란?

데이터 민주화는 비즈니스 사용자가 데이터를 사용해 신속한 의사 결정을 내릴 수 있도록 이들에게 데이터에 대한 접근성을 부여하는 것입니다. 데이터 민주화에서 IT의 역할은 이들 사용자에게 데이터를 제공하는 것이 아니라, 조직의 통제 하에 필요한 데이터에만 접근하도록 하는 것입니다.


통제는 무질서를 방지하기 위해 필요합니다. 예를 들어, 조직은 데이터에 대한 통제력을 잃고 데이터가 USB 드라이브, 사용자의 개인 디바이스와 같은 예측할 수 없는 위치에 저장되는 상황을 원하지 않습니다. 조직은 데이터가 HIPAA와 같은 산업 법규 및 GDPR과 같은 개인정보 보호법을 준수하는 방식으로 사용되도록 해야 합니다. 또한, 사용자가 잘못된 데이터를 분석하고 그 결과로 잘못된 의사 결정을 내리는, 쓰레기가 들어오면 쓰레기가 나오는 상황도 방지해야 합니다.


그러나 데이터 민주화에 조직의 통제를 포함하는 가장 큰 이유는 효율성입니다. 대부분의 사용자는 데이터를 이해하지 못하기 때문에 데이터로 효율적으로 작업하지 못합니다. 왜 이해하지 못할까요? 이들이 데이터 소스의 데이터베이스와 구조, 스키마, 테이블과 열 이름을 만들지 않았기 때문입니다. 또한, 자신의 부서를 위한 데이터 소스가 만들어질 당시 그 현장에 있었다 해도, 조직 내 다른 부서에 있는 데이터가 필요한 경우에는 어떻게 될까요? 고객의 기호에 대한 여러 데이터를 취합해 전체적인 시야를 얻고자 하는 비즈니스 관리자라면 영업, 운영, 금융, 마케팅, 전자상거래 부서의 데이터가 필요할 것입니다. 이 상황은 마치 커피 한 잔을 사기 위해 5가지 언어가 필요한 것과 마찬가지입니다.


비즈니스 사용자에게 데이터 소스에 대한 접근 권한을 부여하려면 이들은 IT나 데이터베이스 프로그래밍이 아닌 비즈니스 전문가임을 유의해야 합니다. 이들이 쓸모없는 곳에서 유용한 데이터를 찾으며 시간을 낭비하도록 해서는 안 됩니다.


왜 데이터 민주화인가?

데이터 민주화는 사용자가 조직을 위한 최선의 의사 결정을 내리는 데 필요한 요소를 제공하기 위한 3개의 축을 기반으로 한 IT 접근 방식인 데이터 권한 부여(data empowerment)와 관련됩니다.


세 가지 중 첫번째 축은 데이터 거버넌스입니다. 데이터에 대한 360도 시야를 얻으려면 어떤 데이터를 갖고 있는지, 그 데이터가 무엇을 의미하며 비즈니스와 어떻게 관계가 있는지를 이해해야 합니다. 예를 들어, “각 지역에서 누가 우리 제품을 구매하는가?”라는 질문에 답하려면 고객 및 판매 분야의 데이터 소스를 살펴본 다음 쿼리할 필드를 결정할 것입니다.


위에서 설명한 바와 같이 거버넌스에도 가드레일, 즉 데이터와 관련된 규칙과 정책, 규정에 대한 이해가 필요합니다. 고객 및 판매 부문의 데이터에 개인 식별 정보가 포함됩니까? 이 데이터의 사용에 대한 규정 또는 표준을 준수해야 합니까? 고객의 개인 데이터를 원하는 아무 용도로나 사용할 권한은 기업에 없습니다. 개인 데이터 사용에는 제약이 따릅니다. 개인정보 보호는 현재 모든 곳에서 중요한 화두이며, 미국의 경우 개별 주마다 자체적인 개인정보 보호 규정을 만들고 나서면서 규제의 지뢰밭이 되고 있습니다.


요약하면, 데이터 거버넌스는 데이터로부터 최대한의 비즈니스 가치를 끌어내는 것과 그 데이터에 따르는 위험을 줄이는 것 사이의 아슬아슬한 줄타기와 같습니다. 위험에는 민감한 데이터를 보호 및 암호화하지 않을 경우에 직면하는 벌금, 각종 불이익, 회사 평판 손상이 포함됩니다.


두 번째 축은 데이터 운영입니다. 데이터 운영에는 사용하기 위해 데이터를 준비하고 비즈니스 사용자에게 데이터의 가용성을 보장하는 과정이 포함됩니다. 간단히 쿼리 하나에 5분이 걸린다면 사용자에게 조직의 모든 데이터에 대한 접근 권한을 부여하더라도 의미가 없습니다. 데이터를 제공하는 시스템은 비즈니스 요구사항을 충족하기에 충분한 수준의 성능을 내야 합니다.


마지막으로, 데이터 보호는 데이터가 적절히 백업되고 수많은 엔드포인트가 보호되도록 보장하기 위한 체계입니다. 데이터 아카이빙, 컴플라이언스와 감사에 대비한 보존이 포함됩니다. 이는 부적절하게 사용되지 않도록 민감한 데이터에 대한 정책을 설정하는 데까지 확장됩니다. 예를 들어, 개인정보 보호법이 고객 정보의 무분별한 조사 및 사용을 금지한다면 데이터 보호 기술은 판매 데이터는 사용 가능한 상태로 두면서 이름, 주소, 나이와 같은 개인 식별 정보를 가릴 수 있습니다.


조직의 IT 리소스는 쿼리 결과에 대한 사용자의 요청을 이행하는 것이 아니라, 이 세 가지 축, 즉 데이터 거버넌스, 데이터 운영 및 데이터 보호에 초점을 맞춰야 합니다.


데이터 민주화가 ‘지금’ 필요한 이유

데이터 민주화가 필연적인 된 이유는 데이터를 얻는 데 있어 IT가 방해가 되어서가 아니라, 데이터가 너무 많고 이 데이터를 사용하기 위한 툴도 너무 많기 때문입니다.


다음과 같은 비즈니스 현실을 생각해 보세요.

- 프로그래머부터 시스템 관리자에 이르기까지 IT 인력의 부족은 현실입니다. 스마트한 조직에서 나타나는 ‘시민 분석가’를 육성하는 방식으로의 전환은 임시 방펴보다는 향후 비즈니스 전략의 일부가 될 가능성이 있습니다.


- 모든 기회에는 수명이 있습니다. 따라서 필요한 데이터를 적시에 얻지 못하면 기회를 놓칠 수 있습니다. 최근의 사례에서는 코로나바이러스의 확산 속도를 늦추고 백신 개발을 촉진하는 데 있어서 데이터 분석이 중요한 역할을 할 수 있음이 입증되었습니다. 모든 기업이 이 같은 삶과 죽음을 가르는 의사 결정에 직면하는 것은 아니지만, 거의 모든 기업은 강력한 경쟁자를 직면합니다. 올바른 데이터에 근거한 신속한 의사 결정은 앞서 나가기 위한 열쇠입니다.


- 데이터 과학자들은 시간의 최대 45%를 데이터 로드 및 정제를 포함한 데이터 준비 작업에 소비합니다. 몇 년 전의 75~85%에 비하면 개선되었지만, 여전히 분석이 아닌 마사지에 상당한 시간을 소비하고 있습니다.


데이터 준비 시간을 자세히 분석해보면 일반적으로 시작은 “이 문제를 해결하는 데 도움이 되는 어떤 데이터를 갖고 있는가?”와 같은 질문에 대한 답을 찾는 것입니다. 대부분의 사람들은 조직에서 어떤 데이터를 사용할 수 있는지를 모릅니다. 또한 안다 해도 어디에 있는지, 그 데이터에 어떻게 접근해야 하는지를 모릅니다. 따라서 다음 질문은 “시스템 X, 시스템 Y 등은 누구의 소유인가?” 그리고 “이러한 시스템의 데이터에 접근하려면 어떻게 해야 하는가?”입니다.


데이터 소스에 접근한 사람은 뜻을 이해하기 어려운 테이블과 필드 이름 등 그 소스 안에 있는 데이터에 관한 난해한 설명에 직면할 가능성이 높습니다. 결국 “이 필드가 순매출액 필드가 맞는가?”, “세전 이익 필드는 어느 필드인가? 세후 이익 필드는?”과 같은 질문이 뒤따릅니다. 그런 다음 원하는 수치를 얻기 위해 여러 개의 데이터 포인트 조각을 결합해야 할 수 있습니다. 이들은 “이 테이블의 필드가 저 테이블의 필드와 관련되어 있는가? 어떻게 관련되는가? 이 둘을 어떻게 결합해야 하는가?”와 같은 질문을 던지게 됩니다.


이 준비 과정의 장애물은 데이터 민주화 프로세스의 속도를 저하시킵니다. IT 부서의 적절한 담당자에게 전화를 걸어 데이터에 대한 안내를 부탁해야 한다면 그 속도는 한층 더 느려집니다.


데이터 민주화는 셀프 서비스 쇼핑!

이상적으로 비즈니스 사용자가 적절한 데이터를 찾고 사용하는 과정은 온라인 쇼핑을 하거나 볼 영화를 찾는 것만큼 쉬워야 합니다. 데이터 민주화의 핵심은 가드레일 사이에서 적절한 데이터로 안내해 사용자의 손에 쥐어 주는 것입니다.


즉, 사용자 관점에서는 다음과 같은 기능이 포함된 셀프 서비스 쇼핑 경험과 같습니다.

- 원하는 데이터를 찾을 때까지 적절한 매개변수를 사용하여 탐색

- 데이터에 대한 더 자세한 정보 얻기 – 데이터에 포함된 것과 포함되지 않은 것, 데이터가 파생되는 방법

- 원하는 데이터와 데이터를 받는 예상 시기를 보여주는 장바구니 사용

- 과거에 해당 데이터를 사용한 적이 있고 그 데이터에 대한 부가적인 정보를 알려줄 수 있는 사람들로 구성된 커뮤니티에 참여

- IT 전문가가 아닌 온전히 비즈니스 사용자로 구성된 생태계에 참여

- 데이터 전송을 원하는 경우 데이터가 암호화되었는지 여부 확인

- 개인정보 보호법을 위반하지 않도록 데이터가 익명화되었는지 여부 확인


이것이 이상적인 상태입니다.


솔직히 말해서 데이터 쇼핑은 전동 공구나 머리 손질용 상품이나 빨간색 구두를 쇼핑하는 것보다 훨씬 더 재미없는 일입니다. 따라서 저 이상적인 상태에 도달할 때까지 실제 데이터 민주화의 형태는 다음과 같습니다.


시작은 이렇습니다.



기업의 비즈니스 사용자가 살펴봐야 할 모델링 툴, 보고서 생성기, 클라우드 제공업체, ERP 및 관계형 데이터베이스가 뒤섞여 있습니다. 그 위에 데이터 사용과 관련된 규칙, 규정, 표준, 코드, 감사 요구사항과 같이 사용자가 통과해야 할 여러 관문도 있습니다.


반면, 데이터 민주화는 다음과 같은 형태입니다.


왼쪽에서는 데이터베이스 전문가가 원하는 물리적 데이터 시스템과 구조를 찾을 수 있고, 오른쪽에서는 비즈니스 분석가가 필요한 개체를 찾을 수 있습니다. 여기에는 정책과 거버넌스의 가드레일이 적용됩니다.


이 조합은 데이터 민주화를 가능하게 하여 데이터가 조직에서 어떻게 흐르는지, 데이터를 어디서 구할 수 있는지, 어느 기업 사용 정책이 적용되는지를 볼 수 있도록 합니다.


데이터 민주화를 통해 더 많은 사람들에게 비즈니스 의사 결정에 필요한 것을 제공함으로써 풍부한 데이터를 제대로 활용할 수 있게 됩니다. 사용자는 데이터 포인트 간의 구조와 관계를 밝히는 툴을 통해 데이터와 최대한 근접한 곳에서 데이터를 분석하고 의사 결정을 내릴 수 있습니다.


데이터 민주화, 데이터베이스 관리에 궁금한 점이 있으시면 언제든 퀘스트소프트웨어 코리아로 문의 주시기 바랍니다.


퀘스트소프트웨어코리아(주)

서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600

전자 메일 KoreaMarketing@quest.com 


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB


퀘스트소프트웨어코리아(주) 서울특별시 강남구 테헤란로 445 본솔빌딩10F
전화 번호 02-3420-9000 | 팩스 번호 02-569-3600 | 전자 메일 KoreaMarketing@quest.com


Copyright © Quest. All Rights Reserved.

Hosting by I'MWEB