데이터 레이크(Data Lake)는 구조화·반구조화·비구조화 데이터를 원시 형태 그대로 대규모로 저장하는 중앙 저장소입니다. 사전 스키마 정의가 필요 없어(schema-on-read) 유연성이 높고, 저렴한 객체 스토리지(Amazon S3, Azure Data Lake Storage)를 기반으로 합니다. 데이터 과학, 머신러닝, 실시간 분석에 활용되며, 데이터 웨어하우스와 결합한 레이크하우스 아키텍처로 진화하고 있습니다.
데이터 레이크(Data Lake)는 구조화·반구조화·비구조화 데이터를 원시 형태 그대로 대규모로 저장하는 중앙 저장소입니다. 사전 스키마 정의가 필요 없어(schema-on-read) 유연성이 높고, 저렴한 객체 스토리지(Amazon S3, Azure Data Lake Storage)를 기반으로 합니다. 데이터 과학, 머신러닝, 실시간 분석에 활용되며, 데이터 웨어하우스와 결합한 레이크하우스 아키텍처로 진화하고 있습니다.