Amazon Web Services
테라데이타 Vantage와 함께 AWS 인프라 사용
독특한 관점을 가진 집중된 리포지토리입니다.
데이터 마트는 제한된 사용자 그룹에 서비스를 제공하는 데이터 웨어하우스 논리 모델의 주제 지향적인 한 부분입니다. 대부분의 사용자에게는 데이터 웨어하우스에 있는 전체 테이블의 데이터 하위 집합만 필요합니다. 예를 들어, 마트에는 판매 거래, 제품 및 재고 기록만 있을 수 있습니다. 대부분의 마트에는 4,000개가 아닌 5~20개의 테이블만 있습니다.
데이터 마트의 테이블 수는 데이터베이스 크기와 관련이 없습니다. 예를 들어, 주요 테이블이라고 하는 팩트 테이블은 통신 회사에 대한 100s의 테라바이트의 통화 세부 기록일 수 있습니다. 데이터 마트 자체는 거대할 수 있지만 데이터 웨어하우스에서 사용할 수 있는 모든 데이터에 대한 선택은 제한적입니다.
데이터 마트 솔루션은 종종 비정규화되어 데이터 정렬 및 결과 테이블 집계를 통해 데이터 요약만 캡처하고, 일반적으로 세부 데이터를 버립니다. 일부 데이터는 매주 또는 매월 완전히 다시 로드됩니다. 보고서가 거래의 마지막 30일만 표시하도록 모든 데이터를 삭제하고 새로 고침하는 것이 비교적 쉽습니다.
스타 스키마
데이터 마트와 스타 스키마는 불가분의 관계에 있습니다. 5개의 스프레드시트에 있는 데이터 행과 열을 상상해 보세요. 이 중 4개의 스프레드시트는 팩트 테이블이라고 불리는 가장 큰 시트와 일치하는 키 필드를 통해 연결됩니다. 팩트 테이블이 스프레드시트에 맞지 않는 5천만 개의 레코드로 데이터 마트 테이블에 저장되어 있다고 상상해 보십시오. 대부분의 경우 이 스타 스키마 디자인에 5~10개의 테이블이 있으며, 스타 암에 있는 작은 테이블을 차원 테이블이라고 합니다.
눈송이 스키마
차원은 중요한 정보가 있는 작은 테이블을 말합니다. 팩트 테이블에는 수십억 개의 레코드와 같은 대량의 데이터가 저장되며, 고객 테이블과 조인하여 실제 고객 이름 및 주소 필드를 얻을 수 있습니다. 변형인 눈송이 스키마에는 키 필드로 서로 연결된 여러 팩트 테이블이 있습니다. 각 팩트 테이블에는 4~5개의 차원 테이블만 있습니다. 테이블 및 관계 집합의 다이어그램은 눈송이와 비슷하지만 여전히 데이터 마트입니다.
데이터 마트와 데이터 웨어하우스의 차이점은 데이터베이스 크기가 아니라 스키마 복잡성으로 구분되는 주제 영역과 통합에 달려 있습니다. 모든 데이터가 웨어하우스에 있기 때문에 데이터 마트보다 데이터 웨어하우스에서 질문하는 것이 100배 더 정교합니다.
데이터 웨어하우스에는 많은 "퍼즐 조각"이 있으며 모든 통합 테이블은 주제 영역으로 그룹화되어 있습니다. 데이터 웨어하우스가 클 필요는 없습니다. 저장 공간이 5TB일 수 있고, 또는 수백 테라바이트의 레코드가 있을 수 있습니다. 대안으로는 데이터 마트에 3개의 거대한 테이블을 저장하는 것입니다.
데이터 로드
데이터 통합을 위한 도구나 데이터를 보관할 데이터베이스, 데이터 분석을 위한 도구가 많이 있습니다. 소량의 데이터를 보고서 또는 대시보드용 BI(비즈니스 인텔리전스) 도구로 이동하는 작업은 노동 집약적이지 않습니다. 실제 비용은 데이터 이동 및 변환에서 발생합니다.
데이터 이동
통합 단계에는 노동 및 컴퓨팅 처리 측면에서 아주 많은 것이 요구되지만, 이 대안으로는 비즈니스 사용자에게 잘못되었거나, 불완전하거나 부정확한 데이터를 제공하여 사용자가 다시 스프레드시트를 사용하게 하는 것입니다. 이것이 바로 데이터 웨어하우스 데이터가 가치 있고 데이터 마트 확산이 위험한 이유입니다..
테라데이타 Vantage는 만연한 데이터 인텔리전스를 위한 플랫폼입니다. 클라우드 친화적인 아키텍처는 어디서나 회사 데이터를 100% 활용하도록 설계되었습니다. 테라데이타 서비스 팀은 기업이 보유한 데이터에서 필요한 답변을 얻을 수 있도록 지원하는 데 능숙합니다.