Hadoop이란?

Hadoop은 빅 데이터를 저장하고 처리하기 위한 분산 데이터 관리 플랫폼 또는 오픈 소스 소프트웨어 프레임워크입니다. 때로는 축소된 분산 운영 체제로 알려져 있습니다. 방대한 양의 데이터를 관리 및 작업하고 수천 대의 상용 컴퓨터로 구성된 대규모 클러스터로 선형 확장하도록 설계되었습니다. 원래 Yahoo!용으로 개발되었지만 지금은 Apache Software Foundation을 통해 무료로 모든 사람들이 사용할 수 있으며, 이것을 사용하려면 일반적으로 광범위한 프로그래밍 지식이 요구됩니다.