데이터는 가장 큰 경쟁 우위가 될 잠재력을 지니고 있습니다. 따라서 기업이 애널리틱스, 머신 러닝, 인공 지능과 같이 데이터에서 인사이트를 끌어내는 방법에 투자하는 것은 당연합니다. 하지만 거의 모든 기업이 데이터 거버넌스 문제를 겪고 있습니다. 제대로 된 데이터 거버넌스 프레임워크를 마련하지 않고 거버넌스가 모두의 당면 과제임을 인식시키지 않으면 데이터 거버넌스에서 발생하는 다양한 문제가 방해가 될 수도 있습니다.
데이터를 인텔리전스 소스이자 전략적 우위로 사용하려면 데이터를 손쉽게 이해하고 소비할 수 있어야 합니다. 동시에 기업을 위험에 빠트리지 않는 방식으로 데이터를 사용하도록 유도하는 가드레일도 마련해야 합니다.
이번 포스팅에서는 대부분 기업이 경험하는 데이터 거버넌스 관련 문제를 살펴보고 이런 문제를 극복하는 방법에 대해 알아보겠습니다.
문제 1. 데이터 거버넌스의 비즈니스 가치 이해하기
기업은 지속적으로 데이터를 생성합니다. 현대 기업에서 다루는 데이터의 양이 방대하게 불어나자 이 데이터를 조작하고 제공하기 위한 디지털 트랜스포메이션 이니셔티브의 필요성이 대두되었습니다. 하지만 비즈니스 관리자는 데이터를 빨리 얻는 것에서는 반사적으로 가치를 인식하지만, 가드레일을 사용해 잘 이해되고 적절하게 제어되는 데이터를 얻는 것에서는 가치를 반사적으로 인식하지 않습니다. 데이터를 조금 더 빠르게 확보한다고 해도 품질이 확보되지 않거나 출처를 모르는 데이터라면 궁극적으로 아무것도 얻지 못한다는 것을 비즈니스 관리자에게 보여주는 것이 데이터 거버넌스의 대표적인 과제입니다.
디지털 트랜스포메이션을 받아들이는 속도가 비교적 느린 기업은 비즈니스 가치를 이해하기 특히 어렵습니다. 디지털 트랜스포메이션을 구현하는 데서 얻는 이점은 관련된 데이터를 직원, 고객, 파트너 등과 공유하는 역량입니다. 데이터 민주화는 비즈니스를 성장시킬 잠재력을 갖고 있지만, 이를 위해서는 데이터 거버넌스의 가드레일이 반드시 필요합니다.
한 가지 해결 방법으로 등장한 것이 CDO(Chief Data Officer)입니다. 처음에 CDO는 데이터에 중점을 두고 CIO 휘하에서 일했습니다. 그러다가 시간이 지나면서 CIO와 동급으로 올라섰고 데이터에 대한 기업의 여러 갈증을 효율적으로 해소하는 역할을 맡았습니다. CDO의 역할에는 데이터 거버넌스를 시행하고 이를 최우선 순위로 유지하는 아키텍처와 데이터 플랫폼을 구축하는 일도 포함됩니다.
애널리틱스 그룹도 데이터 거버넌스의 비즈니스 가치를 강화할 수 있습니다. 애널리틱스 그룹은 인사이트를 제공하는 일을 담당하는 경우가 많으므로 품질이 낮거나 오해석 또는 오용된 데이터 영향을 가장 크게 받습니다.
문제 2. IT가 데이터를 소유한다는 인식
초기에는 많은 기업이 데이터 거버넌스를 IT에 떠넘겼습니다. 일정한 규칙을 두고 데이터에 대한 접근 권한을 제한하는 것이 데이터 거버넌스의 전부라고 생각했기 때문입니다. 데이터 거버넌스는 대부분 중요치 않은 개념으로 인식됐고 실제 비즈니스 가치를 지닌 것으로 취급되지 않았으므로 IT 예산 삭감에서 살아남지 못했습니다.
이와 관련한 데이터 거버넌스 문제 중 하나는 IT가 데이터를 소유하며, 따라서 데이터의 거버넌스도 IT가 책임진다는 인식이 광범위하게 퍼져 있다는 점입니다. 데이터 거버넌스 대부분은 누가 데이터를 소유하는지를 명확히 밝히는 것입니다. IT가 데이터, 그리고 데이터 거버넌스를 소유한다는 개념은 디지털 트랜스포메이션을 가로막는 장애물입니다. 데이터에 대한 모든 의사 결정에서 첫 번째 고려 사항은 비즈니스 관점이며, IT는 그 이후에 해당 의사 결정을 실천할 수 있게 해주는 역할을 합니다. 더 정확히 이해하기 위해 데이터베이스 관리자의 역할을 생각해 보십시오. DBA는 데이터베이스를 소유하지만 데이터 자체를 소유하지는 않습니다. 이들의 소관은 데이터를 담고 있는 매개체를 관리하는 데 국한됩니다.
데이터에 영향을 미치는 솔루션을 구현할 때, 그 솔루션이 미치는 영향에 대해 비즈니스 측과 논의하지 않고 IT가 구현 의사 결정을 내려서는 안 됩니다. 지속 불가능한 프로세스이며 역행하는 것입니다.
그래서 현명한 기업은 성공을 위해 데이터 거버넌스를 비즈니스 측으로 돌려줍니다. 이들 기업은 이해관계자들에게 데이터 거버넌스를 소유하지 않을 때의 위험을 보여주고, 데이터 거버넌스가 기업에 줄 수 있는 가치를 보여주기 시작했습니다. 또한 데이터 소유권도 비즈니스 기업의 관리자에게 있음을 명시하기 시작했습니다. 유럽 연합의 한 대형 공공 기관은 이 변화를 성공적으로 이행했습니다. 그 결과 첫 18개월 동안 외부 데이터 관리 비용을 30% 줄이고 데이터 검색 시간을 50% 단축했으며, 비즈니스 영향 측면에서는 800만 유로를 절감했습니다. 핵심은 오라클 데이터를 누가 소유하느냐, SQL 서버 데이터를 누가 소유하느냐가 아니라 영업 데이터는 영업 부서가 소유하고 마케팅 데이터는 마케팅 부서가 소유한다는 것입니다.
이 문제를 극복하기 위한 최선의 방법은 DBA와 협력해서 데이터에 대한 액세스 권한을 제공하는 데이터 스튜어드를 지정하는 것입니다. 이렇게 하면 사람들에게 데이터 액세스 권한을 남발할 일도, DBA에 막혀 정체될 일도 없습니다.
문제 3. 부족하거나 잘못 할당된 리소스
경영진이 데이터 거버넌스의 중요성을 인식하고, 비즈니스가 거버넌스를 주도하고, IT가 대응한다고 가정했을 때 다음 문제는 부족한 리소스, 잘못 할당된 리소스입니다. 데이터 소유자와 데이터 스튜어드라는 새로운 역할을 누구에게 맡겨야 할까요?
데이터 거버넌스가 본격적으로 추진될 때 가장 좋은 것은 이런 역할을 전담할 직원을 두는 것입니다. 데이터 소유자를 지정하는 것은 어렵지 않습니다. 고위 의사 결정자에게 몇 가지 부가적인 의사 결정을 더 맡기면 되는 일이기 때문입니다. 그러나 데이터 스튜어드는 찾기 까다롭습니다.
데이터 거버넌스에서 ROI 달성에 있어 큰 장애물은 스킬 부족이므로 대부분 기업은 부족한 지식을 가진 누군가를 교육시켜 데이터 스튜어드로 만들고자 합니다. 처음 시작할 때 대부분 기업은 비즈니스 부서에서 데이터를 자주 다루는 직원에게 시간제로 데이터 스튜어드 역할을 맡깁니다. IT 측에서는 보통 데이터 설계자 또는 데이터 애널리스트가 시간제로 이 부가적인 역할을 맡습니다. 비즈니스 애널리스트와 비즈니스 인텔리전스(BI) 전문가는 데이터에 익숙하고 팀의 기술 인력과도 친숙하므로 좋은 데이터 스튜어드 후보입니다.
데이터 거버넌스의 ROI를 입증하고 나면 이런 역할을 전담할 사람들을 찾기 위한 로드맵과 계획이 있어야 합니다. 대규모 기업이라면 장기적으로 여러 비즈니스 라인을 포괄하는 8~10명의 데이터 스튜어드를 둘 수도 있습니다.
전담 데이터 스튜어드를 둘 만한 리소스가 없는 기업이라면 컨설턴트라는 방법을 사용할 수 있습니다. 여기서 컨설턴트는 IT 컨설턴트나 아웃소싱 개발자가 아닌 전문 업체의 데이터 거버넌스 전문가를 말합니다. 일부 컨설팅 업체는 이 역할을 충족할 수 있는 데이터 거버넌스 전문가를 중심으로 한 사업을 구축하고 있습니다. 규모가 작고 기간도 제한되는 경우 컨설팅을 이용하는 것이 초기 성공을 위한 좋은 방법입니다.
문제 4. 데이터 사일로
많은 측면에서 데이터 사일로가 발생하는 원인은 데이터 운영에 대한 여러 가지 접근 방법, 그리고 여러 가지 버전의 기술에 있습니다. 대부분 기업은 현대화를 추진할 때 레거시 데이터가 저장된 시스템을 마이그레이션할 방법을 마련하지 않습니다. 이런 시스템은 여전히 제 역할을 하는 데다가 단순히 떼어 내고 대체할 수 없기 때문입니다. 또한 레거시 데이터에 무엇이 포함되어 있는지 모르는 경우에는 하향식 통합을 통해 문제를 해결하는 편이 비용이 덜 듭니다.
예를 들어, 전통적인 관계형 데이터베이스는 메인프레임의 많은 부분을 대체합니다. 관계형 데이터베이스는 트랜잭션 처리 속도를 높여주지만, 고도로 구조화된 데이터가 필요합니다. 그렇다면 비디오, 소셜 미디어와 같은 구조화되지 않은 새로운 데이터는 어떻게 처리해야 할까요? NoSQL 데이터베이스에 집어넣을 수 있지만 이 경우 새로운 사일로가 생성되므로 결국 한 데이터베이스에서 2가지 영역의 이점을 모두 제공하는 하이브리드 데이터베이스를 선택하게 됩니다.
데이터 사일로는 자연스러운 현상입니다. 비즈니스 관점에서 생각해 보십시오. 비즈니스 자체는 대부분 사일로 형태로 고립되며, 트랜잭션에 집중하는 사람들은 전략에 집중하는 사람들과 소통하지 않습니다. 마케팅, 영업, 제조, 엔지니어링 등에 이미 사일로가 존재하므로 이들의 데이터 역시 사일로에 고립됩니다.
이 사일로에서 벗어나는 것이 기업이 생산하는 데이터를 더욱 잘 활용하기 위한 핵심 조건입니다.
한 가지 방법은 비즈니스의 다양한 부분에서 다양한 용도로 사용되는 다양한 기술의 다양한 데이터 유형에 대한 모든 정보를 수집하는 것입니다. 적절한 데이터 거버넌스 툴을 갖추면 다양한 데이터 유형의 메타데이터를 연결해서 일관된 방식으로 볼 수 있습니다. 그런 다음 인프라의 아키텍처를 매핑하고, 정적 문서에서 캡처하는 방법보다 더 동적으로 업데이트할 수 있습니다. 문서를 데이터베이스 인스턴스 자체에서 수집하는 방법으로 문서를 대체하고, 이를 분석하고 유용하게 만들 수 있는 환경으로 가져올 수 있습니다.
메타데이터 관리는 데이터 거버넌스의 성공적인 운영을 위한 기반입니다. 물론 비즈니스 사용자는 데이터가 오라클에 있는지, SQL 서버나 몽고DB 또는 다른 플랫폼에 있는지에 관심이 없습니다. 이들은 데이터가 비즈니스에서 어떻게 흐르고, 자신에게 오는 지점이 어디인지만 알면 그만입니다.
문제 5. 낮은 데이터 품질과 데이터에 대한 신뢰의 부족
낮은 품질은 신뢰 부족으로 이어지고 이는 곧 사용 부족과 전략적 결과의 부족으로 이어집니다. 따라서 데이터 품질 역시 데이터 거버넌스의 대표적인 과제입니다. 팀이 중요한 의사 결정을 내리기 위해 사용하는 데이터를 신뢰하지 않는다면, 데이터는 전략적 의사 결정에 도움이 되기보다는 장애물이 됩니다.
데이터의 품질이 얼마나 낮은 지 알고 있다고 해도 낮은 데이터 품질을 반영한 조정을 통해 좋은 결과를 얻을 수 있습니다. 데이터 거버넌스의 중요한 측면 중 하나는 낮은 데이터 품질 문제에 대처할 수 있도록 품질이 낮은 지점이 어디인지를 파악하는 것입니다. 이를 통해 데이터에 대한 신뢰를 더 높일 수 있습니다.
기술적인 수준에서 낮은 데이터 품질의 예를 들면 다음과 같습니다.
고객 데이터베이스의 특정 필드에서 항목의 75%가 비어 있습니다.
시간이 지나면서 벤더 테이블에 수천 개의 중복된 행이 누적됩니다.
누군가가 애플리케이션을 테스트하기 위해 수백 개의 더미 레코드를 생성한 이후 깜박 잊고 이 레코드를 삭제하지 않습니다.
데이터 거버넌스에 포함되는 한 가지 방법은 데이터 인텔리전스 툴을 사용해서 데이터 품질에 관한 메트릭과 임계치를 설정하고 모니터링하는 것입니다. 또한 피드백 루프를 구축해 사용자들이 저품질 데이터를 보고하면 추후 사용할 수 있도록 정리할 수 있습니다. 비즈니스 사용자가 사용할 수 있는 데이터에 투명성을 제공하면 사용자는 데이터에 의존할 만큼 품질이 괜찮은지 스스로 판단할 수 있습니다.
문제 6. 부족한 데이터 컨텍스트
동전의 다른 면, 즉 데이터 컨텍스트에 대해서도 주의를 기울여야 합니다. 낮은 데이터 품질은 신뢰 부족으로 이어지지만 유일한 원인은 아닙니다. 사용자가 데이터의 진정한 의미를 쉽게 볼 수 없는 것이 원인일 수도 있습니다. 데이터 집합에 ‘최종 매출’이라는 레이블이 있다고 가정해 봅시다. 이 말이 ‘총매출액’일까요, ‘순매출액’일까요? 또는 일련의 레코드가 매출 기회로 제안되었지만 사실은 마케팅 잠재 고객(MQL)인 경우도 있을 것입니다.
이런 예는 데이터 문제가 아닌 인식의 문제입니다. 해결 방법은 앞서 설명한 피드백 루프입니다. 이를 통해 사용자가 데이터에 대한 질문과 불확실한 부분을 전달하도록 해서 이들에게 전체 컨텍스트를 제공할 수 있습니다.
문제 7. 데이터 컨트롤의 부재
IT와 데이터의 관계로 돌아와서, IT 부분에서는 뛰어나지만 데이터 거버넌스에는 그렇지 못한 기업은 잘못된 종류의 컨트롤을 너무 많이 두고 있는 경우가 보통입니다. 공격 표면 방어와 영업 기밀 보호에 대한 우려로 인해 정작 데이터에서 가장 큰 가치를 얻을 수 있는 사람들까지 차단하게 됩니다.
데이터 거버넌스의 목적 중 하나는 기업 데이터를 가장 잘 활용할 사람들을 막지 않는 것입니다. ‘아니요’라고 말하는 연습이 아니라, 확신을 갖고 ‘예’라고 말할 수 있는 상황을 만들어 나가야 합니다. 데이터 거버넌스로부터 얻은 컨텍스트 및 이해와 함께 데이터에 대한 제대로 된 컨트롤이 있으면 적절한 수준의 컨트롤을 달성할 수 있습니다.
기업은 반사적으로 데스크톱, 데이터베이스 및 사용자 ID 보호와 같은 수단을 선택합니다. 올바른 방향으로 가는 단계지만, 데이터 환경을 이해하지 못하면 이런 수단을 다양한 데이터 소스 전반에 효과적으로 적용할 수 없습니다. 데이터 거버넌스 툴은 각 데이터 자산의 용도가 무엇인지, 어디에 사용해야 하고 사용해서는 안 되는지 정리하는 데 도움이 됩니다.
결론
여기서 설명한 데이터 거버넌스 과제와 씨름하는 기업은 다음과 같은 4가지 영역을 포괄하는 접근 방법이 적절합니다.
사람 – 소유권, 책임, 후원을 명확히 정의해서 적절한 사람을 지정합니다.
프로세스 – 데이터 거버넌스의 배경에서 진행되는 모든 부분을 지원하고 유지하기 위한 적절한 프로세스를 실행합니다.
기술 – 데이터 인텔리전스 툴은 위험을 낮추고 기회를 가속화하는 데 도움이 됩니다.
문화 – 데이터 거버넌스를 회사 목표에 연계하고 성공을 측정하는 방법의 일부로 만들 수 있습니다.
기업에서 데이터를 최대한 활용하기 위해서는 데이터를 액세스하고 관리하고 신뢰할 수 있어야 합니다. 또한 규정을 준수하면서 데이터를 사용하고 오용에서 보호해야 합니다. 강력한 데이터 거버넌스 툴을 사용하면 보다 쉽게 데이터를 발견 및 이해하고 메타데이터를 사용하여 출처와 신뢰성을 입증하며, 정책과 베스트 프랙티스에 따르도록 할 수 있습니다. 잘 구현된 데이터 거버넌스 프로그램은 이와 관련해 직면할 수 있는 여러 문제에 대응하며, 기업은 툴셋을 통해 확신을 갖고 보안을 유지하면서 데이터 접근성을 더 넓힐 수 있습니다.
데이터 거버넌스와 데이터베이스 관리에 어려움을 겪고 계시거나 궁금한 점이 있으시면 언제든 퀘스트소프트웨어 코리아로 문의주시기 바랍니다.

데이터는 가장 큰 경쟁 우위가 될 잠재력을 지니고 있습니다. 따라서 기업이 애널리틱스, 머신 러닝, 인공 지능과 같이 데이터에서 인사이트를 끌어내는 방법에 투자하는 것은 당연합니다. 하지만 거의 모든 기업이 데이터 거버넌스 문제를 겪고 있습니다. 제대로 된 데이터 거버넌스 프레임워크를 마련하지 않고 거버넌스가 모두의 당면 과제임을 인식시키지 않으면 데이터 거버넌스에서 발생하는 다양한 문제가 방해가 될 수도 있습니다.
데이터를 인텔리전스 소스이자 전략적 우위로 사용하려면 데이터를 손쉽게 이해하고 소비할 수 있어야 합니다. 동시에 기업을 위험에 빠트리지 않는 방식으로 데이터를 사용하도록 유도하는 가드레일도 마련해야 합니다.
이번 포스팅에서는 대부분 기업이 경험하는 데이터 거버넌스 관련 문제를 살펴보고 이런 문제를 극복하는 방법에 대해 알아보겠습니다.
문제 1. 데이터 거버넌스의 비즈니스 가치 이해하기
기업은 지속적으로 데이터를 생성합니다. 현대 기업에서 다루는 데이터의 양이 방대하게 불어나자 이 데이터를 조작하고 제공하기 위한 디지털 트랜스포메이션 이니셔티브의 필요성이 대두되었습니다. 하지만 비즈니스 관리자는 데이터를 빨리 얻는 것에서는 반사적으로 가치를 인식하지만, 가드레일을 사용해 잘 이해되고 적절하게 제어되는 데이터를 얻는 것에서는 가치를 반사적으로 인식하지 않습니다. 데이터를 조금 더 빠르게 확보한다고 해도 품질이 확보되지 않거나 출처를 모르는 데이터라면 궁극적으로 아무것도 얻지 못한다는 것을 비즈니스 관리자에게 보여주는 것이 데이터 거버넌스의 대표적인 과제입니다.
디지털 트랜스포메이션을 받아들이는 속도가 비교적 느린 기업은 비즈니스 가치를 이해하기 특히 어렵습니다. 디지털 트랜스포메이션을 구현하는 데서 얻는 이점은 관련된 데이터를 직원, 고객, 파트너 등과 공유하는 역량입니다. 데이터 민주화는 비즈니스를 성장시킬 잠재력을 갖고 있지만, 이를 위해서는 데이터 거버넌스의 가드레일이 반드시 필요합니다.
한 가지 해결 방법으로 등장한 것이 CDO(Chief Data Officer)입니다. 처음에 CDO는 데이터에 중점을 두고 CIO 휘하에서 일했습니다. 그러다가 시간이 지나면서 CIO와 동급으로 올라섰고 데이터에 대한 기업의 여러 갈증을 효율적으로 해소하는 역할을 맡았습니다. CDO의 역할에는 데이터 거버넌스를 시행하고 이를 최우선 순위로 유지하는 아키텍처와 데이터 플랫폼을 구축하는 일도 포함됩니다.
애널리틱스 그룹도 데이터 거버넌스의 비즈니스 가치를 강화할 수 있습니다. 애널리틱스 그룹은 인사이트를 제공하는 일을 담당하는 경우가 많으므로 품질이 낮거나 오해석 또는 오용된 데이터 영향을 가장 크게 받습니다.
문제 2. IT가 데이터를 소유한다는 인식
초기에는 많은 기업이 데이터 거버넌스를 IT에 떠넘겼습니다. 일정한 규칙을 두고 데이터에 대한 접근 권한을 제한하는 것이 데이터 거버넌스의 전부라고 생각했기 때문입니다. 데이터 거버넌스는 대부분 중요치 않은 개념으로 인식됐고 실제 비즈니스 가치를 지닌 것으로 취급되지 않았으므로 IT 예산 삭감에서 살아남지 못했습니다.
이와 관련한 데이터 거버넌스 문제 중 하나는 IT가 데이터를 소유하며, 따라서 데이터의 거버넌스도 IT가 책임진다는 인식이 광범위하게 퍼져 있다는 점입니다. 데이터 거버넌스 대부분은 누가 데이터를 소유하는지를 명확히 밝히는 것입니다. IT가 데이터, 그리고 데이터 거버넌스를 소유한다는 개념은 디지털 트랜스포메이션을 가로막는 장애물입니다. 데이터에 대한 모든 의사 결정에서 첫 번째 고려 사항은 비즈니스 관점이며, IT는 그 이후에 해당 의사 결정을 실천할 수 있게 해주는 역할을 합니다. 더 정확히 이해하기 위해 데이터베이스 관리자의 역할을 생각해 보십시오. DBA는 데이터베이스를 소유하지만 데이터 자체를 소유하지는 않습니다. 이들의 소관은 데이터를 담고 있는 매개체를 관리하는 데 국한됩니다.
데이터에 영향을 미치는 솔루션을 구현할 때, 그 솔루션이 미치는 영향에 대해 비즈니스 측과 논의하지 않고 IT가 구현 의사 결정을 내려서는 안 됩니다. 지속 불가능한 프로세스이며 역행하는 것입니다.
그래서 현명한 기업은 성공을 위해 데이터 거버넌스를 비즈니스 측으로 돌려줍니다. 이들 기업은 이해관계자들에게 데이터 거버넌스를 소유하지 않을 때의 위험을 보여주고, 데이터 거버넌스가 기업에 줄 수 있는 가치를 보여주기 시작했습니다. 또한 데이터 소유권도 비즈니스 기업의 관리자에게 있음을 명시하기 시작했습니다. 유럽 연합의 한 대형 공공 기관은 이 변화를 성공적으로 이행했습니다. 그 결과 첫 18개월 동안 외부 데이터 관리 비용을 30% 줄이고 데이터 검색 시간을 50% 단축했으며, 비즈니스 영향 측면에서는 800만 유로를 절감했습니다. 핵심은 오라클 데이터를 누가 소유하느냐, SQL 서버 데이터를 누가 소유하느냐가 아니라 영업 데이터는 영업 부서가 소유하고 마케팅 데이터는 마케팅 부서가 소유한다는 것입니다.
이 문제를 극복하기 위한 최선의 방법은 DBA와 협력해서 데이터에 대한 액세스 권한을 제공하는 데이터 스튜어드를 지정하는 것입니다. 이렇게 하면 사람들에게 데이터 액세스 권한을 남발할 일도, DBA에 막혀 정체될 일도 없습니다.
문제 3. 부족하거나 잘못 할당된 리소스
경영진이 데이터 거버넌스의 중요성을 인식하고, 비즈니스가 거버넌스를 주도하고, IT가 대응한다고 가정했을 때 다음 문제는 부족한 리소스, 잘못 할당된 리소스입니다. 데이터 소유자와 데이터 스튜어드라는 새로운 역할을 누구에게 맡겨야 할까요?
데이터 거버넌스가 본격적으로 추진될 때 가장 좋은 것은 이런 역할을 전담할 직원을 두는 것입니다. 데이터 소유자를 지정하는 것은 어렵지 않습니다. 고위 의사 결정자에게 몇 가지 부가적인 의사 결정을 더 맡기면 되는 일이기 때문입니다. 그러나 데이터 스튜어드는 찾기 까다롭습니다.
데이터 거버넌스에서 ROI 달성에 있어 큰 장애물은 스킬 부족이므로 대부분 기업은 부족한 지식을 가진 누군가를 교육시켜 데이터 스튜어드로 만들고자 합니다. 처음 시작할 때 대부분 기업은 비즈니스 부서에서 데이터를 자주 다루는 직원에게 시간제로 데이터 스튜어드 역할을 맡깁니다. IT 측에서는 보통 데이터 설계자 또는 데이터 애널리스트가 시간제로 이 부가적인 역할을 맡습니다. 비즈니스 애널리스트와 비즈니스 인텔리전스(BI) 전문가는 데이터에 익숙하고 팀의 기술 인력과도 친숙하므로 좋은 데이터 스튜어드 후보입니다.
데이터 거버넌스의 ROI를 입증하고 나면 이런 역할을 전담할 사람들을 찾기 위한 로드맵과 계획이 있어야 합니다. 대규모 기업이라면 장기적으로 여러 비즈니스 라인을 포괄하는 8~10명의 데이터 스튜어드를 둘 수도 있습니다.
전담 데이터 스튜어드를 둘 만한 리소스가 없는 기업이라면 컨설턴트라는 방법을 사용할 수 있습니다. 여기서 컨설턴트는 IT 컨설턴트나 아웃소싱 개발자가 아닌 전문 업체의 데이터 거버넌스 전문가를 말합니다. 일부 컨설팅 업체는 이 역할을 충족할 수 있는 데이터 거버넌스 전문가를 중심으로 한 사업을 구축하고 있습니다. 규모가 작고 기간도 제한되는 경우 컨설팅을 이용하는 것이 초기 성공을 위한 좋은 방법입니다.
문제 4. 데이터 사일로
많은 측면에서 데이터 사일로가 발생하는 원인은 데이터 운영에 대한 여러 가지 접근 방법, 그리고 여러 가지 버전의 기술에 있습니다. 대부분 기업은 현대화를 추진할 때 레거시 데이터가 저장된 시스템을 마이그레이션할 방법을 마련하지 않습니다. 이런 시스템은 여전히 제 역할을 하는 데다가 단순히 떼어 내고 대체할 수 없기 때문입니다. 또한 레거시 데이터에 무엇이 포함되어 있는지 모르는 경우에는 하향식 통합을 통해 문제를 해결하는 편이 비용이 덜 듭니다.
예를 들어, 전통적인 관계형 데이터베이스는 메인프레임의 많은 부분을 대체합니다. 관계형 데이터베이스는 트랜잭션 처리 속도를 높여주지만, 고도로 구조화된 데이터가 필요합니다. 그렇다면 비디오, 소셜 미디어와 같은 구조화되지 않은 새로운 데이터는 어떻게 처리해야 할까요? NoSQL 데이터베이스에 집어넣을 수 있지만 이 경우 새로운 사일로가 생성되므로 결국 한 데이터베이스에서 2가지 영역의 이점을 모두 제공하는 하이브리드 데이터베이스를 선택하게 됩니다.
데이터 사일로는 자연스러운 현상입니다. 비즈니스 관점에서 생각해 보십시오. 비즈니스 자체는 대부분 사일로 형태로 고립되며, 트랜잭션에 집중하는 사람들은 전략에 집중하는 사람들과 소통하지 않습니다. 마케팅, 영업, 제조, 엔지니어링 등에 이미 사일로가 존재하므로 이들의 데이터 역시 사일로에 고립됩니다.
이 사일로에서 벗어나는 것이 기업이 생산하는 데이터를 더욱 잘 활용하기 위한 핵심 조건입니다.
한 가지 방법은 비즈니스의 다양한 부분에서 다양한 용도로 사용되는 다양한 기술의 다양한 데이터 유형에 대한 모든 정보를 수집하는 것입니다. 적절한 데이터 거버넌스 툴을 갖추면 다양한 데이터 유형의 메타데이터를 연결해서 일관된 방식으로 볼 수 있습니다. 그런 다음 인프라의 아키텍처를 매핑하고, 정적 문서에서 캡처하는 방법보다 더 동적으로 업데이트할 수 있습니다. 문서를 데이터베이스 인스턴스 자체에서 수집하는 방법으로 문서를 대체하고, 이를 분석하고 유용하게 만들 수 있는 환경으로 가져올 수 있습니다.
메타데이터 관리는 데이터 거버넌스의 성공적인 운영을 위한 기반입니다. 물론 비즈니스 사용자는 데이터가 오라클에 있는지, SQL 서버나 몽고DB 또는 다른 플랫폼에 있는지에 관심이 없습니다. 이들은 데이터가 비즈니스에서 어떻게 흐르고, 자신에게 오는 지점이 어디인지만 알면 그만입니다.
문제 5. 낮은 데이터 품질과 데이터에 대한 신뢰의 부족
낮은 품질은 신뢰 부족으로 이어지고 이는 곧 사용 부족과 전략적 결과의 부족으로 이어집니다. 따라서 데이터 품질 역시 데이터 거버넌스의 대표적인 과제입니다. 팀이 중요한 의사 결정을 내리기 위해 사용하는 데이터를 신뢰하지 않는다면, 데이터는 전략적 의사 결정에 도움이 되기보다는 장애물이 됩니다.
데이터의 품질이 얼마나 낮은 지 알고 있다고 해도 낮은 데이터 품질을 반영한 조정을 통해 좋은 결과를 얻을 수 있습니다. 데이터 거버넌스의 중요한 측면 중 하나는 낮은 데이터 품질 문제에 대처할 수 있도록 품질이 낮은 지점이 어디인지를 파악하는 것입니다. 이를 통해 데이터에 대한 신뢰를 더 높일 수 있습니다.
기술적인 수준에서 낮은 데이터 품질의 예를 들면 다음과 같습니다.
고객 데이터베이스의 특정 필드에서 항목의 75%가 비어 있습니다.
시간이 지나면서 벤더 테이블에 수천 개의 중복된 행이 누적됩니다.
누군가가 애플리케이션을 테스트하기 위해 수백 개의 더미 레코드를 생성한 이후 깜박 잊고 이 레코드를 삭제하지 않습니다.
데이터 거버넌스에 포함되는 한 가지 방법은 데이터 인텔리전스 툴을 사용해서 데이터 품질에 관한 메트릭과 임계치를 설정하고 모니터링하는 것입니다. 또한 피드백 루프를 구축해 사용자들이 저품질 데이터를 보고하면 추후 사용할 수 있도록 정리할 수 있습니다. 비즈니스 사용자가 사용할 수 있는 데이터에 투명성을 제공하면 사용자는 데이터에 의존할 만큼 품질이 괜찮은지 스스로 판단할 수 있습니다.
문제 6. 부족한 데이터 컨텍스트
동전의 다른 면, 즉 데이터 컨텍스트에 대해서도 주의를 기울여야 합니다. 낮은 데이터 품질은 신뢰 부족으로 이어지지만 유일한 원인은 아닙니다. 사용자가 데이터의 진정한 의미를 쉽게 볼 수 없는 것이 원인일 수도 있습니다. 데이터 집합에 ‘최종 매출’이라는 레이블이 있다고 가정해 봅시다. 이 말이 ‘총매출액’일까요, ‘순매출액’일까요? 또는 일련의 레코드가 매출 기회로 제안되었지만 사실은 마케팅 잠재 고객(MQL)인 경우도 있을 것입니다.
이런 예는 데이터 문제가 아닌 인식의 문제입니다. 해결 방법은 앞서 설명한 피드백 루프입니다. 이를 통해 사용자가 데이터에 대한 질문과 불확실한 부분을 전달하도록 해서 이들에게 전체 컨텍스트를 제공할 수 있습니다.
문제 7. 데이터 컨트롤의 부재
IT와 데이터의 관계로 돌아와서, IT 부분에서는 뛰어나지만 데이터 거버넌스에는 그렇지 못한 기업은 잘못된 종류의 컨트롤을 너무 많이 두고 있는 경우가 보통입니다. 공격 표면 방어와 영업 기밀 보호에 대한 우려로 인해 정작 데이터에서 가장 큰 가치를 얻을 수 있는 사람들까지 차단하게 됩니다.
데이터 거버넌스의 목적 중 하나는 기업 데이터를 가장 잘 활용할 사람들을 막지 않는 것입니다. ‘아니요’라고 말하는 연습이 아니라, 확신을 갖고 ‘예’라고 말할 수 있는 상황을 만들어 나가야 합니다. 데이터 거버넌스로부터 얻은 컨텍스트 및 이해와 함께 데이터에 대한 제대로 된 컨트롤이 있으면 적절한 수준의 컨트롤을 달성할 수 있습니다.
기업은 반사적으로 데스크톱, 데이터베이스 및 사용자 ID 보호와 같은 수단을 선택합니다. 올바른 방향으로 가는 단계지만, 데이터 환경을 이해하지 못하면 이런 수단을 다양한 데이터 소스 전반에 효과적으로 적용할 수 없습니다. 데이터 거버넌스 툴은 각 데이터 자산의 용도가 무엇인지, 어디에 사용해야 하고 사용해서는 안 되는지 정리하는 데 도움이 됩니다.
결론
여기서 설명한 데이터 거버넌스 과제와 씨름하는 기업은 다음과 같은 4가지 영역을 포괄하는 접근 방법이 적절합니다.
사람 – 소유권, 책임, 후원을 명확히 정의해서 적절한 사람을 지정합니다.
프로세스 – 데이터 거버넌스의 배경에서 진행되는 모든 부분을 지원하고 유지하기 위한 적절한 프로세스를 실행합니다.
기술 – 데이터 인텔리전스 툴은 위험을 낮추고 기회를 가속화하는 데 도움이 됩니다.
문화 – 데이터 거버넌스를 회사 목표에 연계하고 성공을 측정하는 방법의 일부로 만들 수 있습니다.
기업에서 데이터를 최대한 활용하기 위해서는 데이터를 액세스하고 관리하고 신뢰할 수 있어야 합니다. 또한 규정을 준수하면서 데이터를 사용하고 오용에서 보호해야 합니다. 강력한 데이터 거버넌스 툴을 사용하면 보다 쉽게 데이터를 발견 및 이해하고 메타데이터를 사용하여 출처와 신뢰성을 입증하며, 정책과 베스트 프랙티스에 따르도록 할 수 있습니다. 잘 구현된 데이터 거버넌스 프로그램은 이와 관련해 직면할 수 있는 여러 문제에 대응하며, 기업은 툴셋을 통해 확신을 갖고 보안을 유지하면서 데이터 접근성을 더 넓힐 수 있습니다.
데이터 거버넌스와 데이터베이스 관리에 어려움을 겪고 계시거나 궁금한 점이 있으시면 언제든 퀘스트소프트웨어 코리아로 문의주시기 바랍니다.