개요
데이터 거버넌스에 대해 물어봐야 할 다섯 가지 질문
점점 더 많은 데이터 처리가 가장자리로 밀려나고 있습니다. 애자일 혁신을 추진하기 위해 여기에서 필요한 정보를 얻으십시오.
세상이 더 연결됨에 따라 더 많은 데이터 처리가 가장자리로 밀려나고 있습니다. Gartner에 따르면 2022년까지 엔터프라이즈에서 생성된 데이터의 절반 이상이 데이터 센터와 클라우드 외부에서 생성되고 처리될 것이라고 예상하고 있습니다. 그리고 이것은 원격 근무와 사무실 밖에서 모니터링을 가속화하는 COVID-19 이전에 한 예측입니다.
더 많은 위치에서 데이터가 생성되고 개인 정보 보호 규정이 더욱 엄격해짐에 따라 데이터 보호와 광범위한 액세스의 균형을 유지하는 것이 더욱 복잡해지고 있습니다. 그러나 혁신은 우리가 이처럼 다양하고 보급된 방식으로 사용하는 모든 기술에 제공되는 데이터의 무결성과 보안이 보장되는 경우에만 앞으로 나아갈 수 있습니다. 예를 들어, 일부에서는 최근 인공 지능(AI) 투자 감소를 이러한 알고리즘에 공급하는 데이터에 대한 신뢰 부족으로 돌렸습니다. 우수한 거버넌스는 AI 및 기타 고급 혁신에 대한 신뢰를 높이는 가시성과 품질을 제공합니다.
애자일 인프라를 지원하기 위해 데이터 거버넌스 프레임워크를 만들고 있다면 데이터를 보호할 뿐만 아니라 애자일 혁신과 협업을 위한 문화를 구축할 수 있도록 올바른 질문을 해야 합니다. 다음은 선임 영업 담당자 Mike Dampier의 도움으로 고안한 가장 중요한 질문 중 일부입니다:
1. 누가 데이터를 배포하나요?
역사적으로, 기술자들이 비즈니스 사용자에게 "자신의" 데이터를 인수할 것을 촉구함에 따라 데이터 보호 및 거버넌스는 의사 결정권자에게 어려운 대화 주제였습니다. 오늘날 이러한 논의는 더욱 복잡합니다. 비즈니스 팀이 여러 플랫폼에서 데이터로 혁신해야 하는 상황에서 IT와 비즈니스는 이제 데이터 배포 및 관리 책임을 공유합니다.
그러나 IT 및 사업부에서 배포한 데이터의 계보, 출처 및 수명 주기는 매우 다를 수 있습니다. IT가 여전히 애플리케이션 소스, 신뢰할 수 있는 트랜잭션 및 마스터 데이터인 엔터프라이즈 데이터를 소유하고 배포하는 것이 좋습니다. 이 데이터를 외부 공용 도메인 데이터(날씨) 또는 샌드박스, 레이크 및 기타 환경에서 구매한 데이터(인구 통계/사이코그래픽스)와 같은 다른 소스와 통합하는 것이 비즈니스 팀의 임무입니다.
누가 이러한 데이터 유형을 사용하며 얼마나 자주 액세스하는지 아는 것이 중요합니다. 사용자 로그인 세션 및 쿼리를 더 쉽게 모니터링할 수 있도록 테라데이타 Vantage를 빌드할 때 이러한 필요 사항을 염두에 두었습니다. 다른 플랫폼은 이러한 가시성을 확보하기 위해 다양한 모니터링 방법(일부는 자동화되고 나머지는 수동)을 개발하고 배포해야 할 수 있습니다.
2. 누가 무엇을 통제하나요?
이 질문은 까다로울 수 있습니다. 데이터를 수집한 그룹이 데이터를 제어해야 한다고 추측했다면 부분적으로 맞을 것입니다. 비즈니스는 여전히 품질 관점에서 모든 데이터 거버넌스와 엔터프라이즈 데이터와 관련된 비즈니스 관련 메타데이터를 소유합니다. 그러나 이제 비즈니스는 엔터프라이즈 데이터와 통합(필요한 경우)을 보장하기 위해 수집 중인 데이터의 비즈니스 컨텍스트(비즈니스 및 기술 메타데이터)에 대한 거버넌스도 소유합니다.
3. 데이터가 배포되는 곳은 어디인가요?
이 질문을 하면 열띤 토론을 펼칠 수 있습니다. 좋은 클라우드 공급업체를 찾기 위해 알아본 적이 있다면 "귀하의 모든 데이터는 우리와 함께 해야 합니다"라는 말을 반복적으로 들었을 것입니다. 온-프레미스나 클라우드에 관계없이 데이터 레이크에 일부 데이터를 배포하는 것이 좋습니다. 그러나 일부 데이터는 샌드박스, 랩 및 데이터 마트에도 있어야 합니다. 또한 깨끗하고 선별된 신뢰할 수 있는 데이터는 데이터 웨어하우스에 있어야 합니다.
가장 중요한 것은, 플랫폼은 물리적 및 가상 프로젝션을 가능하게 하는 고속 패브릭을 통해 상호 연결되어야 한다는 것입니다. IT는 이 인프라를 지원하기 위해 올바른 데이터 거버넌스 프레임워크를 설정할 책임이 있습니다. 중앙에서 관리되고 확장 가능한 데이터 가상화 기술을 배포하면 복잡한 데이터 동기화 프로세스를 빌드하지 않고도 런타임 시 데이터 공유가 용이합니다. 이는 특정 분석 사용 사례에 대한 실질적인 비즈니스 가치를 가지며 분석 에코시스템 내에서 표준 기능으로 배포해야 합니다.
4. 모두가 데이터 정의에 동의하나요?
비즈니스 사용자는 필요한 데이터를 찾을 위치와 해당 데이터의 의미를 알아야 합니다. Datanami의 Jeff Burk는 "사용 가능한 비즈니스 데이터의 양, 다양성 및 범위가 기하급수적으로 증가하고 있어 찾고, 이해하고, 신뢰하기가 점점 더 어려워지고 있습니다" 라고 했습니다. Burk는 IT와 비즈니스가 동일한 언어를 사용하는 데 도움이 되는 시스템을 만들 것을 권장합니다. 예를 들어 관리되는 데이터 카탈로그는 데이터를 비즈니스 용어로 변환하고 다양한 데이터 세트를 연결하고 연관지을 수 있어야 합니다.
5. 직원들이 데이터 거버넌스에 헌신적인가요?
여느 정부와 마찬가지로 올바른 기술과 프로세스를 설정한다고 해서 좋은 리더십이 보장되는 것은 아닙니다. 거버넌스가 실제로 작동할지 여부를 결정하는 것은 사람들입니다. 데이터 거버넌스 프레임워크의 일부로 설정된 도구와 프로세스는 사람들이 최신 상태로 유지하는 경우에만 작동합니다.
IT와 비즈니스 간의 커뮤니케이션은 모든 단계에서 매우 중요합니다. IT가 엔터프라이즈 데이터 및 셀프 서비스 분석에 대한 보안 액세스를 설정함에 따라 무엇이 작동하고 무엇이 작동하지 않는지 공개적으로 솔직하게 말하는 것이 비즈니스의 임무입니다. 비즈니스는 프로세스가 생성되면 IT에 의존하여 프로세스를 관리할 수 있습니다. IT는 번창하고, 자체 프로비저닝, 비용 효율적인 분석 에코시스템을 만들기 위해 새로운 거버넌스 역할을 맡아야 합니다.
동급 최강의 데이터 거버넌스를 설계하기 위해 노력할 때 이러한 질문을 스스로에게 물어볼 가치가 있습니다. 좋은 거버넌스는 데이터 보호 및 무결성을 넘어 비즈니스 가치를 높이고, 보다 정보에 입각한 전략적 의사 결정, 더 애자일하고 협력적인 문화를 만드는 그 이상의 결과를 가져다 줍니다.