다차원 확장성의 8가지 코어 디멘션

성능 저하 없이 확장

우리는 데이터가 넘치는 시대에 살고 있습니다. 그 어느 때보다 많은 데이터 소스와 유형이 존재합니다. 많은 조직이 분석을 위해 모든 데이터를 수집하는 데 집중하고 있으며, 이를 위해서는 다차원 확장성을 갖춘 연결된 데이터 애널리틱스 에코시스템이 필요합니다.

다차원 확장성을 갖춘 엔터프라이즈 애널리틱스를 위해 연결된 멀티 클라우드 데이터 플랫폼

세분화된 수준에서 애널리틱스 실행

프로젝트가 시작되면 일반적으로 특정 사용 사례에 맞게 설계됩니다. 단일 사용 사례와 한 번에 하나의 데이터 제품으로 접근하는 방식은 확장성이 없습니다. 모든 사용자의 데이터에 대해 언제든지 답변할 수 있도록 확장할 수 있는 엔터프라이즈 애널리틱스용 연결된 멀티 클라우드 데이터 플랫폼이 필요합니다.
 
다차원 확장성을 갖춘 플랫폼은 다른 도메인에 부정적인 영향을 미치지 않으면서 8가지 코어 디멘션에 걸쳐 기능을 동시에 향상시킵니다. 이 수준으로 확장하면 매일 매초 수조 개의 상호 작용에서 수백만 개의 모델을 실행하도록 함으로써 미래의 기업에게 필요한 고급 기능을 제공합니다. 또한 이러한 유형의 확장성을 통해 기업은 세분화된 고객, 서비스 및 금전적 수준에서 애널리틱스를 실행할 수 있습니다.

데이터 애널리틱스 복잡성 극복

많은 기술이 대용량 데이터 볼륨에 대해 점점 더 많은 수의 동시적이고 복잡한 쿼리를 처리하지 못하고 있습니다. 기술이 이러한 수준의 복잡성을 충족할 수 없을 때 다른 차원에서 지름길을 찾거나 적절하게 타협을 하게 됩니다.

상당한 수준으로 증가하는 동시적 쿼리를 처리하기 위해 해당 기술은 사용자에게 다음을 요구합니다:

  • 쿼리의 복잡성 축소

  • 별도 플랫폼 구현

  • 새 클라우드 클러스터 추가

  • 사용자 제한

  • 특정 쿼리 고도 조정

이러한 조치는 가치를 제한하고 복잡성을 추가하며 민첩성을 감소시키고 비용을 증가시킵니다. 또한 미래의 민첩성을 제한하고 부서 간 비즈니스 질문을 할 수 있는 능력을 제한하며 언제든 원하는 정보를 얻을 수 있는 사용자 유연성도 제한합니다. 이것이 바로 엔터프라이즈 애널리틱스용 연결된 멀티 클라우드 데이터 플랫폼이 하이퍼스케일 확장 기능을 제공해야 하는 이유입니다.

클라우드 우선 환경에서 확장성을 위한 5가지 요구 사항

클라우드 우선 환경에서 확장하기 위해 기업은 다음 5가지 요소를 지원하는 최신 클라우드 데이터 애널리틱스 아키텍처가 필요합니다:

  1. 탄력적 확장을 통해 컴퓨팅과 스토리지 분리.

    이 최신 기능을 통해 사용하지 않는 초과 용량 없이 데이터와 사용자 모두의 요구 사항을 지원합니다. 탄력성을 활용해 사용자는 IT 개입 없이 리소스를 동적으로 확장/축소하고 시작/중지할 수 있습니다. 

  2. 자사 클라우드 서비스와 통합.

    Amazon Web Services, Microsoft Azure Google Cloud의 서비스와 긴밀하게 통합하면 데이터 애널리틱스 에코시스템 솔루션 배포를 가속화할 수 있습니다.

  3. 최신 데이터 소스 수집.

    단일 시스템에서 여러 데이터 유형을 지원하면 데이터 통합, 데이터 및 프로세스 중복 제거, 고급 애널리틱스 지원에 도움이 됩니다.

  4. 통합 데이터 관리 및 확장 가능한 애널리틱스.

    데이터 애널리틱스 플랫폼은 애널리틱스 및 데이터 관리를 통합해 사용하기 쉬운 단일 환경에서 대규모 데이터 탐색, 모델링 및 스코어링을 가능하게 하고 데이터 관리 기능을 자동화합니다.

  5. 동적 리소스 할당 및 워크로드 관리.

    플랫폼에는 시스템 리소스와 사용자 워크로드를 동적으로 관리할 수 있는 기능이 필요합니다.

다차원 확장성의 8가지 코어 디멘션

많은 공급업체는 확장 가능한 플랫폼을 여러 쿼리 실행이 가능하며, 향후 데이터 증가 요구 사항을 충족하는 시스템으로 정의합니다. 이 정의만으로는 충분하지 않습니다. 확장성에는 또한 대기 시간, 성능, 안정성, 가용성 및 총 소유 비용과 같은 중요한 요소도 고려해야 합니다.

확장성에는 다음 8가지 필수 도메인이 필요합니다:

  1. 데이터 볼륨

    기본적으로 객체 스토리지에 페타바이트의 데이터를 효율적으로 저장하고 처리합니다. 이를 통해 심층적인 통찰력을 도출하는 데 필요한 모든 데이터에 쉽게 액세스할 수 있습니다.

  2. 쿼리 동시성

    많은 양의 쿼리를 동시에 처리해 더 많은 작업을 더 빠르게 수행합니다. 서비스 수준 약정(SLA)을 준수하면서 복잡하고 리소스를 많이 사용하는 수많은 쿼리를 최적화하고 균형을 맞춥니다.

  3. 쿼리 복잡성

    다중 조인 쿼리를 포함해 복잡하고 가치가 높은 쿼리를 지원합니다. 다양한 비즈니스 기능에 대한 질문이 가능하고 새로운 통찰력을 얻을 수 있습니다.

  4. 스키마 정교성

    확장성을 가진 유연한 데이터 스키마는 모든 비즈니스 요구 사항을 지원하고 이를 가능하게 합니다. 이러한 유연성은 정규화, 반구조화된 스키마 등 모든 스키마와 스키마가 없는 경우도 지원합니다.  

  5. 쿼리 데이터 볼륨

    수동 개입 없이 단일 쿼리로 빠르고 효율적으로 처리할 수 있는 데이터의 양입니다. 올바른 플랫폼을 사용하면 비즈니스 사용자는 모든 데이터를 고려할 수 있으므로 쿼리를 제한할 필요가 없습니다.

  6. 쿼리 응답 시간

    빠르고 일관된 응답 시간을 제공해 엄격한 SLA를 준수합니다.  

  7. 데이터 지연

    쿼리 워크로드를 지원하면서 거의 실시간으로 데이터를 로드 및 업데이트합니다. 사용자는 비즈니스 프로세스와 동기화 상태를 유지하고 현재 데이터에 대한 애널리틱스 요구 사항에 대응할 수 있습니다.

  8. 혼합 워크로드

    단일 환경에서 SLA가 매우 다른 여러 애플리케이션/사용자를 지원하여 워크로드 관리를 단순화하고 SLA를 보장하며 리소스를 극대화합니다.

이러한 확장 기능을 통해 기업은 모든 데이터에 대해 정교하고 새로운 질문을 하여 목표를 달성할 수 있습니다. 예를 들어 다차원 확장성은 Royal Bank of Canada와 같은 기업이 최신 데이터 애널리틱스사용할 수 있도록 지원합니다. 이 제품이 귀사를 위해 무엇을 할 수 있을까요?