온프레미스 및 클라우드 비교: 각 환경의 장단점

데이터 애널리틱스의 미래는 클라우드에 있습니다. Gartner는 2022년까지 모든 데이터베이스의 3/4가 클라우드에 존재하고 그 중 5%만이 온프레미스 환경으로 전환될 수 있는 후보로 간주될 것으로 추정했습니다. 또한 클라우드 데이터베이스 관리 시스템(DBMS)은 내년까지 전체 DBMS 매출의 절반을 차지할 것으로 예상됩니다.

온프레미스 및 클라우드

온프레미스에서 클라우드 애널리틱스까지

애널리틱스를 위한 클라우드 솔루션을 도입하는 데 상대적으로 느린 반도체 제조와 같은 산업에서도 클라우드 컴퓨팅 트렌드는 데이터 아키텍처를 재구성하고 있습니다. 온프레미스 데이터 웨어하우스에 대한 기존 의존도는 점차 클라우드 인프라와 하이브리드 아키텍처로 변화하고 있으며, 이는 온프레미스 회사 데이터 센터 리소스와 퍼블릭 클라우드 서비스를 혼합합니다.

2021년 반도체 엔지니어링 기사에 따르면 기업은 데이터 볼륨의 기하급수적인 증가와 공급망 전반의 데이터 유형 및 운영 복잡성 증가 문제를 처리하기 위해 클라우드 애널리틱스로 전환하고 있습니다. 이와 동시에 다음과 같은 고려 사항으로 인해 온프레미스 옵션은 몇몇 회사 및 직원들에 의해 아직도 사용되고 있습니다:

  • 클라우드 컴퓨팅 및 클라우드 스토리지의 주문형 비용
  • 클라우드 환경의 데이터 안정성 및 성능
  • 회사 소유의 데이터 보안 및 제어

이런 상황에서 온프레미스 및 클라우드 아키텍처를 비교하는 방법과 각 아키텍처를 언제, 왜 사용해야 하는지에 대한 광범위한 질문이 중요합니다. 주로 이러한 문제를 “온프레미스 또는 클라우드 둘 중 하나를 선택”해야 하는 구도로 프레임화하는 것이 일반적이지만 실제로 많은 조직에는 두 아키텍처가 모두 필요하거나 최소한 두 아키텍처를 사용함으로써 이점을 얻을 수 있습니다.

애널리틱스를 위한 온프레미스 및 클라우드 환경 비교: 주요 차이점

온프레미스 환경은 Teradata IntelliFlex와 같은 전용 하드웨어 또는 회사의 기존 데이터 센터 인프라가 지원하는 단일 테넌트 환경입니다. 현장에 위치한 것에서 이름을 따왔습니다. VMWare 가상 머신은 온프레미스 앱을 실행하기 위한 기초로도 사용할 수 있습니다.

퍼블릭 클라우드 컴퓨팅은 클라우드 공급자가 네트워크를 통해 여러 조직과 인프라, 플랫폼 및 애플리케이션의 일부 조합을 공유하는 클라우드 서비스 모델입니다. 공급자의 데이터 센터 리소스는 고객별로 분할되며, 각 고객은 해당 서비스 사용 권한에 따라 구독 또는 선불 요금제를 통해 서비스를 이용합니다.

하나 이상의 퍼블릭 클라우드 서비스를 고객 환경에서 실행되는 단일 테넌트 데이터 플랫폼에 연결할 수 있습니다. 이러한 퍼블릭 클라우드를 온프레미스 인프라와 결합하면 하이브리드 클라우드가 생성됩니다.

배포 위치 및 책임에 대한 이러한 기본적인 차이 외에도 온프레미스 및 클라우드 컴퓨팅은 보다 구체적인 방식에서 차이가 있습니다:

비용

  • 온프레미스: 대부분의 온프레미스 비용은 서버 또는 온사이트 데이터 웨어하우스와 같은 데이터 센터 인프라 구매, 관리 및 유지 과정 중 발생합니다. 특히 하드웨어에 대한 자본 지출이 지배적입니다.
  • 클라우드: 적어도 데이터 웨어하우징의 클라우드 비용은 주로 구독 기반입니다. 클라우드 공급자로부터 클라우드 서버 용량을 사전에 예약할 수 있습니다. 운영 비용이 지배적입니다.

성능

  • 온-프레미스: 조직의 데이터 소스 및 데이터 아키텍처와 물리적으로 매우 가깝기 때문에 온프레미스 인프라는 적절한 규모로 잘 관리되고 최신 상태로 유지되는 한 대기 시간이 짧습니다.
  • 클라우드: 클라우드 인프라 공급자는 최신 데이터 플랫폼과 결합할 때 고급 데이터 애널리틱스에 필요한 성능을 제공하는 사실상 모든 리소스에 대한 무제한적인 액세스를 제공합니다.

확장성 및 탄력성

  • 온프레미스: 온프레미스 환경을 확장한다는 것은 물리적 또는 가상 인프라를 추가하는 것을 의미합니다. 종종 상당한 비용이 들고 실제 필요한 만큼 용량을 정확히 맞추지 못할 수 있습니다(예: 오버프로비저닝이 자주 발생함).
  • 클라우드: 퍼블릭 클라우드를 사용하면 애널리틱스 워크로드 요구 사항이 발전함에 따라 쉽게 확장 및 축소할 수 있습니다. 클라우드는 또한 동적 워크로드에 대해 이러한 리소스 크기를 조정하는 빠른 적응성과 같은 탄력성을 제공합니다.

보안

  • 온프레미스: 온프레미스 데이터 센터를 보호하는 것은 기업의 전적인 책임입니다. 회사는 보안 관행 및 도구에 대해 완전히 통제할 수 있으며, 이와 함께 제공되는 모든 장점과 단점을 가지고 있습니다.
  • 클라우드: 클라우드 보안은 서비스 공급자와 고객 간의 공동 책임입니다. 전자는 사용 중인 클라우드 서비스 유형(서비스로서의 인프라, 서비스로서의 소프트웨어 등)에 따라 보안 스택의 여러 계층을 감독하고 나머지는 고객이 관리합니다. 데이터 보안은 항상 후자의 버킷에 적합합니다.

기능

  • 온프레미스: 기업은 주로 하드웨어 수준에서 온프레미스 환경이 작동하는 방식과 장기 로드맵을 제어합니다. 원하는 수준의 성능, 스토리지 요구 사항, 사용 중인 특정 데이터 아키텍처(데이터 웨어하우스, 데이터 레이크 등)와 모든 데이터 로드 및 쿼리를 지원하기 위해 인프라를 구입하고 유지 관리합니다.
  • 클라우드: 클라우드 서비스 공급자(CSP)와 독립 소프트웨어 공급업체(ISV)는 기업 데이터 저장, 처리 및 확장을 위해 끊임없이 진화하는 소프트웨어 기반 서비스 세트를 제공합니다. 특히 클라우드로 제공되는 AI 및 머신 러닝 혁신은 고급 애널리틱스 워크로드를 위한 중요한 기능이며 클라우드 서비스 오퍼링과 함께 번들로 제공될 수 있습니다. 전반적으로 혁신과 가용성의 속도는 온프레미스보다 클라우드에서 훨씬 빠릅니다.

온프레미스 및 클라우드 애널리틱스의 장단점

온프레미스 리소스와 클라우드 리소스 간의 이러한 주요 차이점을 바탕으로 반드시 한 옵션이 다른 옵션보다 우수하다고 결정할 수 없습니다. 이상적인 선택은 특정 비즈니스 요구 사항에 따라 다르며 실제로 두 옵션을 결합하여 사용할 수 있습니다.

클라우드가 미래임에도 불구하고 클라우드가 주어진 워크로드에 대한 최적의 비용과 성능 조합을 제공하지 않거나 기존 투자를 최적화해야 하는 특정 상황에서는 여전히 온프레미스 애널리틱스가 수행할 역할이 존재합니다. 애널리틱스 워크로드를 실행할 위치를 결정할 때 고려해야 할 가장 중요한 장단점은 다음과 같습니다:

온프레미스 장점

  • 대기 시간이 낮은 로컬 성능
  • 완전한 기술 스택 제어
  • 인프라에 대한 물리적 액세스
  • 데이터 센터 자산 보존

온프레미스 단점

  • 높은 하드웨어 비용 및 감가상각
  • 상대적으로 제한된 탄력성
  • 기업은 오류 및 보안 사고에 대한 전적인 책임을 집니다.
  • 최첨단 애널리틱스 기능에 대해 낮은 액세스
  • 지원 종료 및 교체로 인한 문제

온프레미스 요약 및 사용 사례

온프레미스 데이터 애널리틱스 구현은 많은 회사에서 일상적으로 수행되어 왔습니다. 비즈니스 데이터를 로드하고 쿼리하기 위해 속도, 제어 및 능숙함의 조합에서 이점을 얻습니다.

온프레미스 애널리틱스는 버스팅 또는 재해 복구와 같은 특정 용도를 위해 퍼블릭 클라우드 리소스를 사용하는 하이브리드 클라우드 아키텍처로 전환할 수 있습니다. 성능에 민감한 워크로드는 클라우드 전용 데이터 웨어하우스보다 온프레미스 및 하이브리드 클라우드 배포에 더 적합할 수 있습니다.

기업은 하드웨어의 장착 비용, 오래된 기능, 확장성 및 탄력성의 어려움으로 인해 온프레미스 아키텍처에서 클라우드로 마이그레이션합니다.

예를 들어 노후화된 온프레미스 웨어하우스는 호주 민간보험 제공업체인 Medibank가 멀티 클라우드 데이터 플랫폼으로 마이그레이션하는 원동력이었습니다. 데이터에 더 빠르게 액세스하고 통찰력을 추출하기 위해 퍼블릭 클라우드에 배포된 데이터 플랫폼으로 전환했습니다.

클라우드 장점

  • 엄청난 확장성과 탄력성
  • "종량제" 가격 책정 모델
  • 공급자가 가동 시간, 가용성 및 보안의 일부 측면을 담당
  • AI 및 머신 러닝과 같은 혁신으로 빠르게 확장되는 기능 세트

클라우드 단점

  • 일부 워크로드에 과도할 수 있는 대기 시간
  • 주문형으로만 청구되는 경우 예측할 수 없는 가격 책정
  • 가변성/일정한 활용도 없이 워크로드에서 가장 비용 효율적이지 않습니다.
  • 하이브리드 아키텍처에는 긴밀한 호환성과 상호 운용성이 필요합니다.

클라우드 사용 사례

클라우드 데이터 웨어하우스, 데이터 레이크 및 데이터 레이크하우스는 온프레미스 인프라의 실행 가능한 대안이 되었습니다. 우수한 탄력성과 함께 AI 및 머신 러닝 처리를 통해 고급 애널리틱스에 광범위하고 확장되는 기능 세트를 제공합니다.

데이터 볼륨이 증가하고 데이터 소스의 수가 증가함에 따라 클라우드 컴퓨팅 서비스는 적응할 수 있는 방대한 리소스와 유연성을 제공합니다. Seagate와 IDC의 2021년 보고서에 따르면 엔터프라이즈 데이터 성장률은 주로 데이터 애널리틱스 프로젝트로 인해 향후 2년 동안 40%를 초과할 것으로 예상됩니다.

그러나 클라우드 애널리틱스를 최대한 활용하고 주문형 가격으로 인해 과도한 비용이 발생하는 것을 방지하려면 필요에 따라 여러 클라우드와 온프레미스 리소스에 연결할 수 있는 최신 데이터 플랫폼이 지원되는 일관된 전략이 필요합니다. Seagate와 IDC 응답자는 이러한 다양한 환경을 모두 관리하는 데 수반되는 복잡성에 대한 우려를 가장 큰 과제로 꼽았습니다.

캐주얼 레스토랑 회사인 Brinker의 경우, 연결된 멀티 클라우드 플랫폼은 오래된 레거시 환경과 이전에 시도한 클라우드 전용 데이터 웨어하우스에서 가능하지 않은 정확히 조합된 짧은 대기 시간과 쉽고 일관된 데이터 액세스를 제공했습니다. 조직은 사일로를 제거하고 모든 유형의 워크로드를 안정적으로 실행하고 확장할 수 있는 능력을 갖추게 되었습니다.

온프레미스 및 클라우드 연결: 하이브리드 클라우드 고려 사항

Brinker의 사례는 "온프레미스 대 클라우드"가 인기 있고 유용한 비교 프레임이지만 "온프레미스 및 클라우드 조합"이 더 현실적임을 보여줍니다. 온프레미스 환경을 퍼블릭 클라우드에 연결하는 하이브리드 클라우드는 기존 투자를 보호하고 대기 시간을 최소화하며 클라우드의 최신 혁신에 계속 액세스하려는 조직에게 가장 실용적인 솔루션인 경우가 많습니다.

데이터 중력의 개념은 온프레미스 및 클라우드 영역에서 두 가지의 장점을 모두 제공하기 위해 노력하는 이러한 하이브리드 클라우드 환경의 주요 동인입니다. 데이터 중력은 데이터가 대량으로 증가함에 따라 필연적으로 더 많은 애플리케이션과 서비스를 유치하여 시간이 지남에 따라 이동하는 것이 더 복잡해지는 것을 말합니다. 따라서 하이브리드 클라우드 환경을 설정할 때 한 환경에서 다른 환경으로 구성 요소를 이동하려면 다음을 신중하게 고려해야 합니다:

  • 데이터 중력 클러스터의 위치와 클러스터가 포괄하는 데이터 소스
  • 이러한 클러스터에서 대량의 데이터 이동과 관련된 잠재적인 클라우드 송신 요금
  • 이러한 이동과 관련된 대기 시간 및 의도한 사용 사례에 허용되는지 여부
  • 한 환경의 애플리케이션 구성 요소가 다른 환경에서 작동하는지 여부

하이브리드 클라우드에는 필연적으로 이러한 유형의 복잡한 고려 사항이 포함되지만 올바른 데이터 플랫폼을 사용하면 전체 여정을 단순화할 수 있습니다.

어디서나 애널리틱스를 수행하는 방법

앞서 논의한 Medibank와 같이, 테라데이타 Vantage는 온프레미스와 클라우드에서 정확히 동일한 소프트웨어를 제공하기 때문에 애널리틱스 현대화 프로젝트를 간소화합니다. 마이그레이션은 중요 애플리케이션을 광범위하게 다시 코딩할 필요 없이 간단합니다.

Vantage와 같은 최신 데이터 플랫폼은 온프레미스 또는 선택한 퍼블릭 클라우드에서 동일한 고급 기능을 제공하는 유연한 배포 옵션을 제공합니다. 주요 기능에는 모든 데이터 소스 및 형식 수집, 정교한 워크로드 관리, 사일로 없는 전사적 데이터 액세스가 포함됩니다. 클라우드에서는 또한 비용을 최적화하기 위해 고객 요구 사항 및 쿼리에 맞는 혼합 가격(용량 예약 및 주문형)을 제공합니다.

기업이 온프레미스 데이터를 여러 클라우드로 마이그레이션하든, 단일 퍼블릭 클라우드에 연결하거나 다른 배포 모델을 추구하든, Vantage는 이를 수행할 수 있습니다.