공유

비정형 데이터란?

비정형 데이터는 고정된 구성 원칙이 없는 필터링되지 않은 정보를 말합니다. 흔히 원시 데이터라고도 불립니다. 일반적인 예로는 웹 로그, XML, JSON, 텍스트 문서, 이미지, 비디오 및 오디오 파일이 있습니다. 비정형 데이터를 검색하고 구문 분석하여 유용한 정보를 추출합니다. 엔터프라이즈 데이터의 80%가 비정형 데이터입니다. 이것은 비정형 데이터가 많은 사람들에게 가장 눈에 띄는 형태의 빅 데이터라는 것을 의미합니다. 통찰력을 생성하기 위해 비정형 데이터의 크기는 확장 가능한 애널리틱스를 필요로 합니다. 비정형 데이터는 저장 비용이 낮기 때문에 대부분의 데이터 레이크에서 찾을 수 있습니다.

비정형 데이터에 대한 가치보다 그 소문이 더 많습니다. 이러한 파일에 숨겨진 가치를 추출하려면 강력한 기술과 도구가 필요합니다. 사람들은 관계형 데이터베이스는 비정형 데이터를 처리할 수 없다고 오해하고 있습니다. 테라데이타의 통합 데이터 아키텍처는 여러 가지 방법으로 비정형 데이터를 수용합니다. 테라데이타 데이터베이스와 경쟁업체는 XML, JSON, Avro 및 기타 형태의 비정형 데이터를 저장하고 처리할 수 있습니다.