기사

오픈 테이블 포맷(OTF)이란 무엇인가요?

오픈 테이블 포맷에 대해 더 알아보세요.

테이블 형식은 데이터 레이크의 효율성과 효과를 향상시키기 위해 작동합니다. 데이터 저장과 관리를 체계적으로 제공함으로써, 오픈 테이블 형식은 전통적인 데이터 레이크에서 종종 결여된 조직 계층을 제공합니다. 데이터 레이크 위에 추상화 계층을 제공하고 데이터베이스와 유사한 기능을 제공합니다. 이 구조화된 접근법은 데이터 접근과 쿼리 성능에 최적화된 방식으로 저장되어 보다 효율적인 데이터 쿼리 및 분석을 가능하게 합니다.

테이블 포맷이 데이터 레이크를 간소화하는 주요 방법 중 하나는 스키마 온리드 기능을 활성화하는 것입니다. 이를 통해 데이터 레이크는 사전 스키마 정의 없이도 다양한 형식과 구조를 가진 다양한 소스의 데이터를 수용할 수 있습니다. 그 결과, 데이터 엔지니어와 분석가는 데이터 준비와 변환 작업에 시간을 낭비하지 않고 데이터로부터 인사이트를 도출하는 데 집중할 수 있습니다. 더불어, 쓰기 시 스키마 검증을 강제할 수 있어 데이터 품질과 일관성을 보장하여 오류와 이상 발생 가능성을 줄입니다.

테이블 포맷은 또한 데이터 레이크에 트랜잭션 지원과 ACID 준수를 도입하여 데이터 무결성과 일관성을 보장합니다. 이는 데이터가 자주 업데이트되거나 여러 사용자가 동시에 접근하고 수정하는 환경에서 특히 중요합니다. 원자 거래를 지원함으로써 오픈 테이블 형식은 데이터 레이크가 조직에 신뢰할 수 있는 진실의 출처가 되어 정확하고 시기적절한 의사결정을 가능하게 합니다. 또한 증분 처리와 시간 이동과 같은 기능들은 데이터 레이크의 유연성을 높여 조직이 시간에 따른 변화를 추적하고 필요에 따라 과거 데이터를 접근할 수 있게 합니다. 이러한 기능들은 오픈 테이블 형식을 데이터 레이크 운영을 최적화하고 데이터 자산의 잠재력을 최대한 끌어내는 데 필수적인 도구가 됩니다.

오늘날 업계에서 흔히 사용되는 세 가지 오픈 테이블 형식, 즉 Apache Iceberg, Linux Foundation Delta Lake, Apache Hudi 사이에는 기능적 동등성이 있습니다. 이들의 생태계, 개발자, 기여자 커뮤니티가 다르기 때문에, 사용 사례와 작업 요구사항에 맞는 지원 생태계를 고려해 OTF를 선택하는 것이 합리적일 수 있습니다. 세 OTF 모두 ACID 트랜잭션과 버전 관리, 스키마 진화, 시간 이동을 지원하며, 복잡한 쿼리 워크로드와 다수의 동시 사용자로부터 높은 성능으로 쓰기를 처리할 수 있습니다.

테라데이터는 다중 클라우드 및 다중 데이터 레이크 환경에서 OTF, 카탈로그, 클라우드 서비스 제공자(CSP) 를 위한 개방형 생태계를 제공합니다.

이 독특하고 개방적이며 연결된 OTF 지원 방식은 Amazon Web Services(AWS) Glue, Hive Metastore, Unity와 같은 오픈 카탈로그를 사용하여 Apache Iceberg 및 Delta Lake 테이블에 저장된 데이터를 교차 읽기, 교차 쓰기, 교차 쿼리할 수 있게 합니다.

이 미래에 대비한 접근법은 기업들이 데이터를 이동, 복제, 변환하지 않고도 대규모로 신뢰할 수 있는 AI 를 제공하는 진정한 현대적 데이터 전략을 활용할 수 있게 합니다.

알고 있어

테라데이트의 블로그를 구독하여 주간 통찰력을 얻을 수 있습니다



I consent that Teradata Corporation, as provider of this website, may occasionally send me Teradata Marketing Communications emails with information regarding products, data analytics, and event and webinar invitations. I understand that I may unsubscribe at any time by following the unsubscribe link at the bottom of any email I receive.

Your privacy is important. Your personal information will be collected, stored, and processed in accordance with the Teradata Global Privacy Statement.