구글(GOOGL)이 생성형 인공지능 기술을 기반으로 한 미디어 제작 도구를 대대적으로 확장하며 크리에이티브 기술 시장 공략을 본격화하고 있다. 이번 발표의 중심에는 영상 창작 도구 '플로(Flow)'가 있으며, 최신 영상 생성 모델 Veo 3와 이미지 생성 기술 Imagen 4, 음악 AI 모델 Lyria 2 등이 동시에 공개됐다.
'플로'는 영상 제작자가 대본, 인물, 배경 등을 자연어로 입력하면 영화 수준의 장면을 자동 생성할 수 있도록 설계된 플랫폼이다. 이 도구는 구글의 생성형 AI ‘제미니(Gemini)’, 이미지 생성 모델 '이미전(Imagen)', 그리고 동영상 생성 엔진 '비오(Veo)'를 통합한 형태로, 프로젝트에서 필요한 모든 시각 요소를 하나의 인터페이스 내에서 구성하고 조율할 수 있게 한다. 사용자는 SceneBuilder, 카메라 뷰 설정, 자산 관리 기능을 통해 영상 전체를 유기적으로 편집할 수 있으며, Flow TV를 통해 다른 사용자의 사례를 참고할 수 있는 기능까지 제공된다.
플로의 기반이 된 실험 프로젝트는 2024년 5월 시작된 '비디오 FX(VideoFX)'였다. 이번에 정식 출시된 버전은 미국 내 'AI 프로' 및 '울트라' 요금제 가입자에게 제공된다.
동시에 공개된 Veo 3는 기술적으로 한층 진화된 영상 생성 모델로, 기존 버전보다 향상된 화질은 물론 배경 소음, 효과음, 인물 대사와 입 모양까지 자연스럽게 합성할 수 있는 기능이 핵심이다. 물리적 상호작용 동기화나 오디오의 시간·공간적 정합성까지 구현할 수 있어 몰입감 있는 스토리텔링을 가능케 한다. 이 모델은 제미니 앱과 Flow, 그리고 기업 고객을 위한 버텍스 AI(Vertex AI)에서 사용할 수 있다.
Veo 3와 함께 업그레이드된 Veo 2 역시 눈에 띈다. 반복 등장하는 캐릭터와 소품, 고급 카메라 무빙, 장면 확장 등 영화적 연출을 위한 도구들이 추가됐다. 이 역시 Flow를 통해 즉시 사용 가능하며, 향후 API를 통해 버텍스 AI로도 확대 적용될 예정이다.
이미지 분야에서는 구글의 최신 모델 Imagen 4가 공개됐다. 속도와 품질을 동시에 개선한 이 모델은 캐릭터 일관성과 자연스러운 시각 효과 구현에 초점을 맞췄다. 구글 워크스페이스(Google Workspace) 내 슬라이드, 영상, 문서 도구는 물론, 제미니 앱과 버텍스 AI에서도 탑재된다.
음악 생성 부문에서는 라이라 2(Lyria 2)가 새롭게 소개됐다. 이 모델은 ‘뮤직 AI 샌드박스(Music AI Sandbox)’와 ‘뮤직FX DJ’에 적용되어, 뮤지션과 작곡가에게 다양한 음악 스타일 실험 기회를 제공한다. 유튜브 쇼츠(YouTube Shorts), AI 스튜디오 등 다양한 채널에서 접근 가능하다.
이번에 공개된 모든 생성형 콘텐츠에는 ‘신스ID(SynthID)’ 워터마킹 기술이 적용된다. 이는 픽셀, 오디오 프레임, 텍스트 단위로 AI 생성 여부를 표시해 진위 판별을 용이하게 하며, 별도의 탐지 도구와 결합해 사용자 누구나 이를 식별할 수 있다. 구글은 이 같은 기술이 생성형 AI 콘텐츠의 신뢰성과 투명성을 제고할 것이라 설명했다.
이번 발표는 크리에이티브 솔루션 시장에서 주도권을 잡으려는 구글의 행보로 풀이된다. 미디어 콘텐츠의 전 주기를 AI로 지원하는 생태계를 완성하며, 경쟁사 대비 기술 선도 이미지도 함께 강화하는 전략이다.