텍스트-비디오 모델(Text-to-Video Model)은 텍스트 설명으로부터 비디오 클립을 생성하는 AI 모델입니다. OpenAI의 Sora, Runway Gen-2, Google Veo, Pika Labs가 대표적이며, 확산 모델·트랜스포머 기반으로 수 초~수십 초의 일관된 영상을 생성합니다. 영화 제작, 광고, 교육 콘텐츠 제작에 혁신을 가져오는 한편, 딥페이크 악용·저작권 이슈 같은 과제도 수반합니다.
텍스트-비디오 모델(Text-to-Video Model)은 텍스트 설명으로부터 비디오 클립을 생성하는 AI 모델입니다. OpenAI의 Sora, Runway Gen-2, Google Veo, Pika Labs가 대표적이며, 확산 모델·트랜스포머 기반으로 수 초~수십 초의 일관된 영상을 생성합니다. 영화 제작, 광고, 교육 콘텐츠 제작에 혁신을 가져오는 한편, 딥페이크 악용·저작권 이슈 같은 과제도 수반합니다.