Data Lake란?

데이터 레이크(Data Lake)는 구조화·반구조화·비구조화 데이터를 원시 형태 그대로 대규모로 저장하는 중앙 저장소입니다. 사전 스키마 정의가 필요 없어(schema-on-read) 유연성이 높고, 저렴한 객체 스토리지(Amazon S3, Azure Data Lake Storage)를 기반으로 합니다. 데이터 과학, 머신러닝, 실시간 분석에 활용되며, 데이터 웨어하우스와 결합한 레이크하우스 아키텍처로 진화하고 있습니다.