합성 데이터(Synthetic Data)는 실제 데이터의 통계적 특성을 유지하면서 통계 모델·생성 AI로 인공적으로 생성한 데이터입니다. 프라이버시 보호, 데이터 희소성 극복, 클래스 불균형 해소, AI 학습 데이터 확보, 시뮬레이션에 활용됩니다. GAN·확산 모델·LLM 등을 이용하며, 개인정보를 직접 노출하지 않고도 데이터의 가치를 공유·활용할 수 있게 해 엔터프라이즈 AI의 핵심 요소로 부상했습니다.
합성 데이터(Synthetic Data)는 실제 데이터의 통계적 특성을 유지하면서 통계 모델·생성 AI로 인공적으로 생성한 데이터입니다. 프라이버시 보호, 데이터 희소성 극복, 클래스 불균형 해소, AI 학습 데이터 확보, 시뮬레이션에 활용됩니다. GAN·확산 모델·LLM 등을 이용하며, 개인정보를 직접 노출하지 않고도 데이터의 가치를 공유·활용할 수 있게 해 엔터프라이즈 AI의 핵심 요소로 부상했습니다.