안녕하세요, 저는 스콧 다익스트라입니다.테라데이타에서 클라우드 솔루션팀을 이끌고 있죠.저는 데이터 사이언티스트이며, 테라데이타의 최대 글로벌 고객들이 분석 환경을 배포할 수 있도록 돕습니다.이미 테라데이타가 기업 분석 분야에서 업계 최고라는 것을 알고 계시겠지만, 클라우드에 최적화된 방식에 놀라실 것입니다.오늘은 테라데이타의 클라우드 서비스 통합, 셀프 서비스 단순성 및 몇 가지 강력한 분석 기능을 보여드리겠습니다.그럼 시작해보죠.오늘 세 가지 데모가 있습니다.코드를 실행하고 SQL에 포함된 머신 러닝 엔진 기능 및 고급 SQL 엔진 기능과 객체 저장소에서 데이터를 가져오는 기본 객체 저장소 기능을 보여줄 수 있는 Vantage Developer부터 시작하겠습니다.예를 들어 코드를 실행하지 않고 nPath와 같은 분석 함수의 결과 집합을 검토할 수 있는 Vantage Analyst를 보여드리겠습니다.마지막으로, 사이트를 관리 및 모니터링하고 백업 관리, 확장 및 축소와 같은 DBA 활동을 할 수 있는 Vantage Operations를 보여드리겠습니다.그럼 Vantage Developer부터 살펴보도록 하죠.제가 시연할 첫 번째 사용 사례는 기본 객체 저장소인데, 여기서 AWS의 S3 또는 Azure Blob 저장소와 같은 객체 저장소 서비스에 직접 접속할 수 있습니다.Telco 데이터에 대한 고객 이탈 이벤트 관련 데이터 세트가 있고, 고객과의 통화 세부 사항 기록을 S3에 저장했다고 가정하겠습니다.자주 사용하지 않으므로 S3에 저장하고, Vantage에는 훨씬 더 자주 사용하는 고객 기록이 있을 수 있습니다.네이티브 객체 저장소를 사용하여 S3를 Vantage의 데이터와 결합하기 위해 제일 먼저 할 일은 Vantage를 S3 버킷 또는 파일로 가리키는 외부 테이블 객체를 만드는 것입니다.
안녕하세요, 저는 스콧 다익스트라입니다.테라데이타에서 클라우드 솔루션팀을 이끌고 있죠.저는 데이터 사이언티스트이며, 테라데이타의 최대 글로벌 고객들이 분석 환경을 배포할 수 있도록 돕습니다.이미 테라데이타가 기업 분석 분야에서 업계 최고라는 것을 알고 계시겠지만, 클라우드에 최적화된 방식에 놀라실 것입니다.오늘은 테라데이타의 클라우드 서비스 통합, 셀프 서비스 단순성 및 몇 가지 강력한 분석 기능을 보여드리겠습니다.그럼 시작해보죠.오늘 세 가지 데모가 있습니다.코드를 실행하고 SQL에 포함된 머신 러닝 엔진 기능 및 고급 SQL 엔진 기능과 객체 저장소에서 데이터를 가져오는 기본 객체 저장소 기능을 보여줄 수 있는 Vantage Developer부터 시작하겠습니다.예를 들어 코드를 실행하지 않고 nPath와 같은 분석 함수의 결과 집합을 검토할 수 있는 Vantage Analyst를 보여드리겠습니다.마지막으로, 사이트를 관리 및 모니터링하고 백업 관리, 확장 및 축소와 같은 DBA 활동을 할 수 있는 Vantage Operations를 보여드리겠습니다.그럼 Vantage Developer부터 살펴보도록 하죠.제가 시연할 첫 번째 사용 사례는 기본 객체 저장소인데, 여기서 AWS의 S3 또는 Azure Blob 저장소와 같은 객체 저장소 서비스에 직접 접속할 수 있습니다.Telco 데이터에 대한 고객 이탈 이벤트 관련 데이터 세트가 있고, 고객과의 통화 세부 사항 기록을 S3에 저장했다고 가정하겠습니다.자주 사용하지 않으므로 S3에 저장하고, Vantage에는 훨씬 더 자주 사용하는 고객 기록이 있을 수 있습니다.네이티브 객체 저장소를 사용하여 S3를 Vantage의 데이터와 결합하기 위해 제일 먼저 할 일은 Vantage를 S3 버킷 또는 파일로 가리키는 외부 테이블 객체를 만드는 것입니다.외부 테이블 만들기 문은 S3에서 데이터가 있는 위치를 Vantage에 알립니다.코드 편집기에서 이 외부 테이블 만들기 문을 만들겠습니다. 이제 Vantage에 S3의 데이터 위치를 알려주는 새 개체를 Vantage에 만듭니다.이제 사업 분석가 또는 데이터 사이언티스트와 같은 최종 사용자는 이 테이블을 Vantage 내의 테이블인 것처럼 쿼리를 실행할 수 있으며, S3 버킷이 어디에 있는지 또는 S3 내 어디에 배치해야 하는지 정확히 알 필요가 없습니다.이제 S3에 접속할 수 있는 외부 테이블이 있으므로 S3에서 데이터를 임시로 가져오고 S3에서 이 고객 통화 세부 기록을 가져와서 Vantage의 핵심 고객 기록 데이터와 결합합니다.따라서 네 줄의 SQL로 실제 해당 결합을 만들 수 있습니다.이 네 줄의 SQL을 가져와서 코드 편집기에 붙여 넣고 이 쿼리를 실행하면, S3의 임시 데이터를 Vantage의 고객 기록과 결합합니다. Vantage의 고객 기록과 함께 S3의 통화 세부 정보 기록의 새 결합 테이블로 설정되었으며, 그 결과는 이제 이 결합 테이블입니다.'S3에 모든 것을 저장하지 않는 이유는 무엇인가요?' 기업 수준에서는 성능이 중요하며, 많은 고객이 자주 사용하는 데이터를 Vantage에 넣고 새로운 데이터 세트 또는 덜 자주 사용하는 데이터를 더 저렴한 비용으로 S3에 저장할 수 있습니다.이제 이 결합 테이블이 준비되었으므로, 이에 대한 분석을 하겠습니다.우리는 테라데이타의 고객 기록과 S3의 통화 세부 사항 기록의 결합 테이블을 가지고 있으며, 이제 테라데이타의 강력한 nPath 기능을 이용하여 고객 경로 결과를 보겠습니다.이 사례에는 통신사의 고객 이탈이 있죠.이제 이 nPath 함수는 표준 SQL에 포함할 수 있는 테라데이타의 고급 SQL 함수이며, 이 함수를 실행하는 방법, 함수를 분할할 위치, 실행할 테이블, 주문 방법 등에 대한 매개변수를 제공할 수 있습니다.제가 지금 실행하고 있는 이 nPath 함수는 S3 데이터와 Vantage 내의 데이터를 결합한 테이블을 가져오며, 그 결과 고객의 경로(이 경우 통신사 고객 이탈)를 보여줄 것입니다. 여기에서 설정한 결과를 보면 고객이 취한 첫 번째 단계, 콜센터에 전화를 거는 단계 및 계정을 폐쇄하는 마지막 단계를 볼 수 있습니다.'Spark를 사용하면 어떻게 되나요?' 좋은 질문입니다.왜 Vantage를 사용해야 하나요?세 가지 큰 이점이 있습니다첫 번째는 SQL 사용자가 이러한 머신 러닝 엔진과 고급 SQL 엔진 기능을 활용할 수 있다는 것입니다.데이터 웨어하우스에서 Spark와 같은 다른 분석 플랫폼으로 데이터를 내보낼 필요가 없습니다.마지막으로, 단일 워크플로를 확장 가능하게 구현합니다.따라서 기존에 데이터가 있는 위치에서 이미 사용 중인 SQL을 이용하여 이 단일 워크플로를 실행하고, 클라우드 또는 온프레미스에서 Vantage를 사용하여 대규모로 배포할 수 있습니다.방금 개발자 환경을 사용하여 머신 러닝 엔진과 nPath와 같은 고급 SQL 엔진 기능을 내장하고 S3의 임시 데이터를 Vantage에 이미 있는 데이터와 결합하는 것이 얼마나 쉬운지 시연했지만, 아무 코드도 실행하지 않고 결과 세트를 검토하려 한다고 가정해 보겠습니다.여기에 Vantage Analyst 환경을 열면 워크플로, 데이터 분석, 엔드 투 엔드 워크플로를 생성하고 관리할 수 있는 네 가지 기능의 워크플로 편집기가 있습니다.데이터 변환 및 분석 계산에 대한 규칙을 작성합니다.코드를 실행하지 않고도 정교한 예측 모델을 만들 수 있습니다.그리고 특정 결과(이 경우 통신사 고객이탈)에 대한 고객 경로를 탐색할 수 있습니다.이제 코드 편집기에서 실행하는 nPath 함수를 사용하고, 실제로 해당 결합 테이블의 결과 세트를 보고, 고객의 이탈 이벤트를 살펴보겠습니다.그 경로는 무엇일까요?여기서 이 시스템에 로그인하고 해당 통신사 고객 이탈 데이터베이스에 다시 연결하여 분석을 할 시작 및 종료 데이터를 선택한 다음 테라데이타의 머신 러닝 엔진을 사용하여 막후에서 nPath 기능을 실행합니다.이제 고객의 계정 시작부터 계정 폐쇄까지 데이터를 멋지게 시각화했습니다.이제 온라인 계정 요약, 계약 검토, 청구서 검토, 청구서 분쟁과 관련한 콜센터 연결 등 경로를 자주 볼 수 있습니다.서비스 불만에 관한 것일 수도 있겠죠.이 데이터 세트에서는고객 9,350명이 본인의 계정 요약을 보고 서비스 불만을 제기했습니다.통신사는 고객 이탈 이유, 고객이 웹사이트에 로그인하여 청구서 분쟁에 대한 서비스에 불만을 제기하고, 계정 폐쇄까지 이르는지 이해하려고 합니다. 테라데이타 SQL 내에 간단히 삽입하거나 Vantage Analyst를 통해 시각화할 수 있는 이 nPath 기능으로 독창적으로 시각화하여 간단하게 이해할 수 있습니다.좋은 질문이 있네요.'어떻게 이것을 운영 시스템화합니까?' 테라데이타는 이 머신 러닝 엔진과 기본 객체 저장소 기능을 온프레미스와 클라우드, 공용 클라우드 모두에 배포할 수 있는 독특한 유연성이 있습니다.AWS, Azure 외에도 곧 GCP를 지원합니다.즉, 온프레미스 또는 클라우드에서 운영 시스템화 준비를 할 수 있습니다.이러한 기능을 구현할 수 있는 곳에는 제한이 없습니다.마지막으로, 사이트를 관리 및 모니터링하고 확장 및 축소와 같은 DBA 활동을 할 수 있는 Vantage Operations 환경을 보여드리겠습니다.지금 이 경우에 AWS 사이트를 하나만 보고 있지만, 단 몇 분만에 AWS 또는 Azure에서 다른 사이트를 신속하게 프로비저닝할 수 있습니다.이 AWS 사이트를 보면 Vantage 환경이 배포된 위치, AWS 지역, 실행 중인 SQL 및 머신 러닝 엔진에 대한 정보, 테라바이트 수, 크기 등의 사이트 정보가 있습니다.셀프 서비스 확장이나 컴퓨팅, 스토리지 확장도 할 수 있습니다.좋은 질문이네요.'컴퓨터와 스토리지를 독립적으로 확장할 수 있나요?' 물론입니다.그것은 최신 클라우드 아키텍처의 요건입니다.고객은 이 Vantage Operations 환경을 사용하는 셀프 서비스를 통해 컴퓨팅 인스턴스의 크기를 늘리고, 더 많은 컴퓨팅 인스턴스를 즉시 추가하고, 스토리지를 점차적으로 늘릴 수 있으며, 이를 독립적으로 실행할 수 있습니다.두 가지를 한 번에 할 필요가 없죠.100 테라바이트에서 110으로, 인스턴스 10개에서 12개 계산으로 갈 수 있으며, 서로 독립적으로 실행할 수 있습니다.이제 S3에도 연결할 수 있습니다.이미 기본 객체 저장소 기능을 보았지만, S3의 자체 고객 버킷에도 셀프 서비스하고 연결할 수 있습니다.마지막으로, CPU 및 디스크 공간 활용도를 보고 백업을 관리할 수 있습니다.오전 1시에 백업을 예약하고 싶다고 가정해 보겠습니다.월요일 아침, 실행 중인 ETL 작업과의 충돌을 피하기 위해 이 운영 환경에서 해당 셀프 서비스를 할 수 있습니다.데이터 사이언티스트 또는 사업 분석가로서 우리 모두가 직면한 최대의 과제는 데이터를 준비하고, 올바른 데이터에 접근하는 것, 충분히 큰 데이터 세트 및 고품질 데이터 세트를 활용하여 귀중한 결과를 얻을 역량과 규모를 갖는 것입니다. 이 모든 것을 한 후에는 어떻게 이를 운영 시스템화하여 실제로 사업 성과를 이끌어내는 방식으로 분석을 배포할까요?많은 실험이 여기에 실패합니다.오늘 보여드린 데모는 데이터 웨어하우스의 모든 데이터와 객체 저장소 데이터와 같은 에코시스템의 외부 데이터 세트를 활용하고, 강력한 분석 및 머신 러닝 엔진 기능을 활용하여 처리하고, 필요에 따라 확장 및 축소하는 방법, Vantage를 통해 온프레미스 및 클라우드 모두에서 운영 시스템화를 하는 방법이었습니다.