Quick Overview 데이터 성숙도를 달성하면 자연스럽게 데이터의 가치를 극대화할 수 있습니다. 우선 반복적인 사용례를 제공하며 사용자의 공감을 얻는 부분을 초기에 확인하고 가치를 높이는 것이 핵심입니다. 또한 데이터 아키텍처 설계부터 카탈로그화, 선별, 서버넌스, 관찰, 채점, 구매에 이어지는 7단계에 대한 로드맵을 마련할 필요도 있습니다. |
성숙한 데이터 환경은 내부 사용자가 데이터에 쉽게 접근하고 이를 활용해 가치를 창출할 수 있도록 지능적인 구조를 갖추고 있습니다. 데이터 성숙도가 낮은 조직은 신뢰할 수 있는 데이터의 부족과 인사이트 결핍으로 데이터 인텔리전스에서 어려움을 겪을 수 있습니다.
1부에서는 데이터 성숙도에 대한 기초 사항과 성숙도가 왜 중요한지 살펴보았습니다. 2부에서는 데이터 성숙도를 달성하고 가치를 극대화하는 7단계를 자세히 알아봅니다.
데이터 가치 극대화는 데이터 성숙도를 향한 단계를 수행함으로써 손쉽게 달성할 수 있습니다. 가장 성공적인 구현은 관련성 있는 사용례에 초점을 두고 처음 90일부터 6~9개월에 걸쳐 점진적으로 더 높은 가치를 제공하는 것입니다.
하지만 완벽하게 될 때까지 마냥 기다리지 마십시오. 무엇이 공감을 일으키는지 조기에 자주 파악해야 하는데, 이를 위한 유일한 방법은 사용자 커뮤니티에 반복적인 사용례를 제공하는 것입니다. 또한 다음 7단계에 대해 사용례와 이정표에 대한 로드맵을 마련하는 것이 좋습니다.
모델
가장 먼저 환경의 청사진부터 결정해야 합니다. 데이터의 논리적, 물리적 측면은 무엇이며, 그 데이터가 어떻게 보이기를 원하나요? 대규모 기업 대부분은 수십 년 동안 비즈니스 관점에서 데이터를 모델링해왔습니다. 규모가 작거나 신생 기업은 정해지지 않은 비즈니스 정의, 비즈니스 계보, PI로 시작하며, 무엇이 핵심 데이터가 되어야 하는지 확실히 모릅니다. 또한 소규모 기업은 빈 비즈니스 용어집 및 카탈로그부터 시작하며 비즈니스 맥락에서 데이터를 이해하기 위한 열쇠인 데이터 도메인을 사전에 구조화하기 위해 노력합니다.
기업의 크기에 관계없이 데이터 성숙도는 데이터 모델링, 그리고 데이터 및 데이터 아키텍처에 대한 비즈니스 관점에서의 이해에서 시작됩니다.
카탈로그
데이터를 카탈로그화한다는 것은 데이터의 인벤토리를 만드는 것입니다. 좋든 싫든, 이 데이터 인벤토리가 기업의 기반이며 비즈니스를 운영하는 바탕입니다. 여기서 가치 있는 사용례는 데이터 포렌식과 관계가 깊습니다. 인벤토리는 데이터 팽창, 중복 및 다크 데이터가 발생한 위치를 보여줍니다. 이 단계의 가치 사용 사례는 일반적으로 데이터의 분류와 프로파일링부터 시작됩니다. 데이터 마이그레이션 또는 통합 프로젝트를 진행 중인 경우 격리된 데이터(비즈니스와 연관되지 않는다면 이 데이터가 필요한가요?), 그리고 프로파일링해서 태그를 지정하고 분류해야 하는 핵심 데이터가 어디에 있는지 알 수 있습니다.
선별
데이터 가치는 데이터가 선별되어 맥락화될 때 실현됩니다. 이것은 기본적으로 비즈니스 관점에서 데이터가 어떻게 사용되는가에 대한 이해입니다. 맥락이 없는 데이터는 숫자 덩어리에 불과합니다. 비즈니스 가치에 연결하지 못하는 데이터는 무의미한 데이터입니다. 핵심 데이터에 대한 비즈니스 컨트롤을 확보하고 나면 데이터가 관련성과 깨끗함을 유지하도록 “보장”해야 합니다. 이를 위한 핵심은 최종 사용자의 채택입니다. 사용자가 필요한 것을 빠르게 찾을 수 있고, 부가적인 장벽을 만들지 않으면서 데이터를 “관리”할 수 있나요? 우리는 사용자가 탐구심을 갖고 답을 찾기를 원하며, 이들의 통찰력을 촉진하고 일상적인 업무 외의 부가적인 일이라는 느낌 없이 협업할 수 있기를 원합니다.
거버넌스
여기서 하는 일은 데이터에 대한 비즈니스 컨트롤을 제공하는 것입니다. 데이터를 위한 맥락을 제공하는 비즈니스 용어든, 이 데이터를 사용하는 방법에 대한 가드레일을 제공하는 정책, 규정 또는 비즈니스 규칙이든, 데이터를 어디서, 어떻게 사용해야 하는지를 설정합니다. 전통적인 규제 요구사항(사베인 옥슬리, BCBS, 리보 금리, GDPR 및 개인정보)에 대해 그렇게 했고, 이제는 책임감 있는 AI 또는 AI 권리장전에 대해서도 마찬가지입니다. AI가 언제 관여하는지 알 권리, 개인정보 보호, 거부는 지금까지 우리가 해온 거버넌스 준수와 매우 비슷합니다.
관찰
데이터 계보. POC든 구현이든 마무리되는 지점이 바로 여기입니다. 종단간에 데이터를 추적할 수 있는 역량은 데이터 품질, 근본 원인 분석, 개인정보 보호와 규제 정책에 대한 “설명 가능성”이라는 가치를 제공합니다. 전통적인 사용례뿐 아니라, 이 챗GPT가 AI를 사용하고 있는지, 마지막 AI 검증에 어떤 데이터 집합이 사용되었는지, 그리고 데이터 품질 수준이 높았는지에 대한 이해가 포함되었는지와 같은 것을 알아야 하는 현대의 사용 사례에도 가치를 제공합니다.
채점
채점은 데이터의 가치에 대한 빠른 지표를 제공합니다. 이 알고리즘은 데이터 프로파일링 결과, 최종 사용자 순위, 데이터 거버넌스 선별의 완성도를 “골드, 실버, 브론즈” 데이터 분류 점수로 조합합니다. 조직은 사용할 패싯과 각 패싯에 부여할 가중치를 선택할 수 있습니다. 나머지는 마켓플레이스가 알아서 합니다. 고객은 더 많은 패싯을 추가하기를 원하므로 이 확장이 반가울 것입니다. 처음 3개의 기준은 더글러스 레이니의 저서 “인포노믹스: 경쟁 우위를 위한 자산으로서 정부를 수익화, 관리, 측정하는 방법”에 나와 있습니다.
구매
마지막으로, 최종 사용자를 위해 장바구니의 데이터를 재배포할 준비가 되었나요? 데이터에 접근하기 위한 안전하고 지능적인 문이 필요한가요? 사용자들이 내부 가드레일을 두고 다양한 데이터베이스 환경에서 직접 데이터를 요청하고 가져올 수 있나요? 데이터 마켓플레이스는 내부 데이터 집합, 서드파티 데이터, 보고서, AI 모델, API 등에 대한 집단 지성이며 모든 데이터 요구를 충족하는 원스톱 상점입니다. 안전하고 신뢰할 수 있는 마켓플레이스가 있으면 최종 사용자들은 데이터를 중심으로 커뮤니티를 형성하기 시작하고 데이터가 오래되거나 미사용 방치되는 것을 방지하는 데 참여하게 됩니다. 이는 “모든 문제를 해결하는” IT 담당자에게 의존하는 대신 조직 전반에서 데이터와 데이터의 정확성에 대한 책임감을 형성하는 데 도움이 될 것입니다.
데이터 성숙도가 앞으로도 중요한 이유
챗GPT는 모든 사람을 대규모 데이터 시대에 맞추어 대비시키는 역할을 하는 대표적인 요소입니다. 모든 조직은 다양한 영역에서 AI를 사용하는 방법과, 이런 모델을 통해 이들이 얻고자 하는 통찰력과 그 기반인 데이터를 이해하고자 합니다.
챗GPT(2023년 5월 기준)
월 방문자 수 18억 명 2개월 만에 사용자 100만 명에서 1억 명으로 증가
챗GPT가 작성한 콘텐츠를 읽은 사람 중 53%는 해당 콘텐츠가 AI에 의해 작성된 것임을 알아차리지 못함
DemandDAge “챗GPT 통계” 2023년 사용자, 추세 및 기타 현황 – 다니엘 루비 |
챗GPT 열풍은 인간이 통제할 수 없는 것이 얼마나 많은지를 잘 보여줍니다. 이탈리아는 챗GPT를 금지했고 곧 독일도 뒤따를 가능성이 있습니다. 미국에서는 AI 리더들이 모여 의회에 AI를 잠시 멈추게 해달라고 요청했습니다. AI를 위한 GDPR에서는 AI가 무언가를 작성할 때 최종 사용자가 이를 알아야 한다고 규정합니다. 데이터 리더는 정책을 정하고 조직과 협력해서 어떤 것을 허용할 수 있는지를 결정해야 합니다.
구조를 제공하고 완전히 관리되는 데이터 제품을 만드는 것은 위험과 혼란의 균형을 맞추기 위한 좋은 방법입니다. 이것이 문제이기 때문입니다. 기업이 편향성과 개인정보 보호의 균형을 맞추면서 유용한 통찰력을 제공하려면 어떻게 해야 할까요?
데이터 제품의 무결성을 보장하기 위해서는 데이터가 어디에서, 어떻게, 어느 정도의 품질로 프로비저닝되는지 이해하는 것이 필수적입니다. 마켓플레이스 환경에서 데이터를 제품으로 제공하면 통찰력 있고 신뢰할 수 있는 결과를 위해 반드시 필요한 신뢰와 확신을 제공할 수 있습니다. 훌륭한 데이터 리더는 현재 데이터 환경의 문제점을 잘 알고 있기 때문에 변화의 필요성을 인식하고 있으며, 조직 전반에 걸쳐 촉진할 강력한 셀프서비스를 갖춘 미래의 가능성을 볼 수 있습니다.
데이터 관리에 어려움을 겪고 계시거나 솔루션에 대해 궁금한 점이 있으시면 언제든 퀘스트소프트웨어코리아로 문의주시기 바랍니다.
Quick Overview
데이터 성숙도를 달성하면 자연스럽게 데이터의 가치를 극대화할 수 있습니다. 우선 반복적인 사용례를 제공하며 사용자의 공감을 얻는 부분을 초기에 확인하고 가치를 높이는 것이 핵심입니다. 또한 데이터 아키텍처 설계부터 카탈로그화, 선별, 서버넌스, 관찰, 채점, 구매에 이어지는 7단계에 대한 로드맵을 마련할 필요도 있습니다.
성숙한 데이터 환경은 내부 사용자가 데이터에 쉽게 접근하고 이를 활용해 가치를 창출할 수 있도록 지능적인 구조를 갖추고 있습니다. 데이터 성숙도가 낮은 조직은 신뢰할 수 있는 데이터의 부족과 인사이트 결핍으로 데이터 인텔리전스에서 어려움을 겪을 수 있습니다.
1부에서는 데이터 성숙도에 대한 기초 사항과 성숙도가 왜 중요한지 살펴보았습니다. 2부에서는 데이터 성숙도를 달성하고 가치를 극대화하는 7단계를 자세히 알아봅니다.
데이터 가치 극대화는 데이터 성숙도를 향한 단계를 수행함으로써 손쉽게 달성할 수 있습니다. 가장 성공적인 구현은 관련성 있는 사용례에 초점을 두고 처음 90일부터 6~9개월에 걸쳐 점진적으로 더 높은 가치를 제공하는 것입니다.
하지만 완벽하게 될 때까지 마냥 기다리지 마십시오. 무엇이 공감을 일으키는지 조기에 자주 파악해야 하는데, 이를 위한 유일한 방법은 사용자 커뮤니티에 반복적인 사용례를 제공하는 것입니다. 또한 다음 7단계에 대해 사용례와 이정표에 대한 로드맵을 마련하는 것이 좋습니다.
모델
가장 먼저 환경의 청사진부터 결정해야 합니다. 데이터의 논리적, 물리적 측면은 무엇이며, 그 데이터가 어떻게 보이기를 원하나요? 대규모 기업 대부분은 수십 년 동안 비즈니스 관점에서 데이터를 모델링해왔습니다. 규모가 작거나 신생 기업은 정해지지 않은 비즈니스 정의, 비즈니스 계보, PI로 시작하며, 무엇이 핵심 데이터가 되어야 하는지 확실히 모릅니다. 또한 소규모 기업은 빈 비즈니스 용어집 및 카탈로그부터 시작하며 비즈니스 맥락에서 데이터를 이해하기 위한 열쇠인 데이터 도메인을 사전에 구조화하기 위해 노력합니다.
기업의 크기에 관계없이 데이터 성숙도는 데이터 모델링, 그리고 데이터 및 데이터 아키텍처에 대한 비즈니스 관점에서의 이해에서 시작됩니다.
카탈로그
데이터를 카탈로그화한다는 것은 데이터의 인벤토리를 만드는 것입니다. 좋든 싫든, 이 데이터 인벤토리가 기업의 기반이며 비즈니스를 운영하는 바탕입니다. 여기서 가치 있는 사용례는 데이터 포렌식과 관계가 깊습니다. 인벤토리는 데이터 팽창, 중복 및 다크 데이터가 발생한 위치를 보여줍니다. 이 단계의 가치 사용 사례는 일반적으로 데이터의 분류와 프로파일링부터 시작됩니다. 데이터 마이그레이션 또는 통합 프로젝트를 진행 중인 경우 격리된 데이터(비즈니스와 연관되지 않는다면 이 데이터가 필요한가요?), 그리고 프로파일링해서 태그를 지정하고 분류해야 하는 핵심 데이터가 어디에 있는지 알 수 있습니다.
선별
데이터 가치는 데이터가 선별되어 맥락화될 때 실현됩니다. 이것은 기본적으로 비즈니스 관점에서 데이터가 어떻게 사용되는가에 대한 이해입니다. 맥락이 없는 데이터는 숫자 덩어리에 불과합니다. 비즈니스 가치에 연결하지 못하는 데이터는 무의미한 데이터입니다. 핵심 데이터에 대한 비즈니스 컨트롤을 확보하고 나면 데이터가 관련성과 깨끗함을 유지하도록 “보장”해야 합니다. 이를 위한 핵심은 최종 사용자의 채택입니다. 사용자가 필요한 것을 빠르게 찾을 수 있고, 부가적인 장벽을 만들지 않으면서 데이터를 “관리”할 수 있나요? 우리는 사용자가 탐구심을 갖고 답을 찾기를 원하며, 이들의 통찰력을 촉진하고 일상적인 업무 외의 부가적인 일이라는 느낌 없이 협업할 수 있기를 원합니다.
거버넌스
여기서 하는 일은 데이터에 대한 비즈니스 컨트롤을 제공하는 것입니다. 데이터를 위한 맥락을 제공하는 비즈니스 용어든, 이 데이터를 사용하는 방법에 대한 가드레일을 제공하는 정책, 규정 또는 비즈니스 규칙이든, 데이터를 어디서, 어떻게 사용해야 하는지를 설정합니다. 전통적인 규제 요구사항(사베인 옥슬리, BCBS, 리보 금리, GDPR 및 개인정보)에 대해 그렇게 했고, 이제는 책임감 있는 AI 또는 AI 권리장전에 대해서도 마찬가지입니다. AI가 언제 관여하는지 알 권리, 개인정보 보호, 거부는 지금까지 우리가 해온 거버넌스 준수와 매우 비슷합니다.
관찰
데이터 계보. POC든 구현이든 마무리되는 지점이 바로 여기입니다. 종단간에 데이터를 추적할 수 있는 역량은 데이터 품질, 근본 원인 분석, 개인정보 보호와 규제 정책에 대한 “설명 가능성”이라는 가치를 제공합니다. 전통적인 사용례뿐 아니라, 이 챗GPT가 AI를 사용하고 있는지, 마지막 AI 검증에 어떤 데이터 집합이 사용되었는지, 그리고 데이터 품질 수준이 높았는지에 대한 이해가 포함되었는지와 같은 것을 알아야 하는 현대의 사용 사례에도 가치를 제공합니다.
채점
채점은 데이터의 가치에 대한 빠른 지표를 제공합니다. 이 알고리즘은 데이터 프로파일링 결과, 최종 사용자 순위, 데이터 거버넌스 선별의 완성도를 “골드, 실버, 브론즈” 데이터 분류 점수로 조합합니다. 조직은 사용할 패싯과 각 패싯에 부여할 가중치를 선택할 수 있습니다. 나머지는 마켓플레이스가 알아서 합니다. 고객은 더 많은 패싯을 추가하기를 원하므로 이 확장이 반가울 것입니다. 처음 3개의 기준은 더글러스 레이니의 저서 “인포노믹스: 경쟁 우위를 위한 자산으로서 정부를 수익화, 관리, 측정하는 방법”에 나와 있습니다.
구매
마지막으로, 최종 사용자를 위해 장바구니의 데이터를 재배포할 준비가 되었나요? 데이터에 접근하기 위한 안전하고 지능적인 문이 필요한가요? 사용자들이 내부 가드레일을 두고 다양한 데이터베이스 환경에서 직접 데이터를 요청하고 가져올 수 있나요? 데이터 마켓플레이스는 내부 데이터 집합, 서드파티 데이터, 보고서, AI 모델, API 등에 대한 집단 지성이며 모든 데이터 요구를 충족하는 원스톱 상점입니다. 안전하고 신뢰할 수 있는 마켓플레이스가 있으면 최종 사용자들은 데이터를 중심으로 커뮤니티를 형성하기 시작하고 데이터가 오래되거나 미사용 방치되는 것을 방지하는 데 참여하게 됩니다. 이는 “모든 문제를 해결하는” IT 담당자에게 의존하는 대신 조직 전반에서 데이터와 데이터의 정확성에 대한 책임감을 형성하는 데 도움이 될 것입니다.
데이터 성숙도가 앞으로도 중요한 이유
챗GPT는 모든 사람을 대규모 데이터 시대에 맞추어 대비시키는 역할을 하는 대표적인 요소입니다. 모든 조직은 다양한 영역에서 AI를 사용하는 방법과, 이런 모델을 통해 이들이 얻고자 하는 통찰력과 그 기반인 데이터를 이해하고자 합니다.
챗GPT(2023년 5월 기준)
월 방문자 수 18억 명
2개월 만에 사용자 100만 명에서 1억 명으로 증가
챗GPT가 작성한 콘텐츠를 읽은 사람 중 53%는
해당 콘텐츠가 AI에 의해 작성된 것임을 알아차리지 못함
DemandDAge “챗GPT 통계” 2023년 사용자, 추세 및 기타 현황 – 다니엘 루비
챗GPT 열풍은 인간이 통제할 수 없는 것이 얼마나 많은지를 잘 보여줍니다. 이탈리아는 챗GPT를 금지했고 곧 독일도 뒤따를 가능성이 있습니다. 미국에서는 AI 리더들이 모여 의회에 AI를 잠시 멈추게 해달라고 요청했습니다. AI를 위한 GDPR에서는 AI가 무언가를 작성할 때 최종 사용자가 이를 알아야 한다고 규정합니다. 데이터 리더는 정책을 정하고 조직과 협력해서 어떤 것을 허용할 수 있는지를 결정해야 합니다.
구조를 제공하고 완전히 관리되는 데이터 제품을 만드는 것은 위험과 혼란의 균형을 맞추기 위한 좋은 방법입니다. 이것이 문제이기 때문입니다. 기업이 편향성과 개인정보 보호의 균형을 맞추면서 유용한 통찰력을 제공하려면 어떻게 해야 할까요?
데이터 제품의 무결성을 보장하기 위해서는 데이터가 어디에서, 어떻게, 어느 정도의 품질로 프로비저닝되는지 이해하는 것이 필수적입니다. 마켓플레이스 환경에서 데이터를 제품으로 제공하면 통찰력 있고 신뢰할 수 있는 결과를 위해 반드시 필요한 신뢰와 확신을 제공할 수 있습니다. 훌륭한 데이터 리더는 현재 데이터 환경의 문제점을 잘 알고 있기 때문에 변화의 필요성을 인식하고 있으며, 조직 전반에 걸쳐 촉진할 강력한 셀프서비스를 갖춘 미래의 가능성을 볼 수 있습니다.
데이터 관리에 어려움을 겪고 계시거나 솔루션에 대해 궁금한 점이 있으시면 언제든 퀘스트소프트웨어코리아로 문의주시기 바랍니다.