생성형 AI 창작 도구 시장의 중심이 이미지에서 영상과 음성으로 이동하고 있다.
9일 a16z에 따르면 초기 생성형 AI 확산을 이끌었던 주요 제품은 미드저니(Midjourney), 달리(DALL-E), 스테이블 디퓨전(Stable Diffusion) 등 이미지 생성 서비스였다. 이들 서비스는 챗GPT 출시 이전에 공개되며 많은 초기 사용자들에게 생성형 AI를 처음 경험하게 한 도구였다.
당시에는 이미지 생성 도구가 창작 AI 시장을 사실상 지배했다. 영상과 음성 생성 기술은 이후에 등장했으며 초기 시장에서는 이미지 생성 서비스가 가장 큰 비중을 차지했다.
그러나 시장 구조는 크게 변화했다. 2023년 9월 발표된 첫 번째 조사에서는 웹 기준 창작 AI 서비스 9개 가운데 7개가 이미지 생성 도구였다. 약 3년이 지난 현재 조사에서는 이미지 생성 서비스가 3개만 남았지만 전체 창작 도구 수는 여전히 7개 수준을 유지하고 있다.
차이는 빈자리를 채운 기술이다. 이미지 생성 서비스가 줄어든 자리를 영상, 음악, 음성 생성 도구가 대체하면서 창작 AI 시장의 중심이 이동했다.
이미지 생성 시장의 변화는 ‘기능 통합(bundling)’의 영향이 컸다. 챗GPT의 GPT Image 1.5와 구글 제미니의 ‘나노 바나나(nano banana)’ 같은 내장 이미지 모델이 빠르게 개선되면서 독립형 이미지 생성 서비스가 경쟁하기 어려운 환경이 만들어졌다.
실제로 초기 조사에서 상위 10위에 포함됐던 미드저니는 현재 순위가 46위까지 하락했다. 현재 목록에 남아 있는 레오나르도(Leonardo), 아이디어그램(Ideogram), 시빗AI(CivitAI) 등은 범용 이미지 생성 경쟁보다는 특정 창작 커뮤니티를 겨냥한 기능 중심 서비스로 자리 잡았다.
이번 조사에서 가장 큰 변화를 보인 분야는 영상 생성 AI였다. 클링 AI(Kling AI), 하일루오(Hailuo), 픽스버스(Pixverse) 등이 빠르게 성장하며 실제 사용자 기반을 확보했다. 특히 중국에서 개발된 영상 생성 모델들이 출력 품질 측면에서 지속적으로 선두를 유지하고 있는 것으로 평가됐다.
향후에는 시댄스 2.0(Seedance 2.0) 기반 애플리케이션도 목록에 등장할 가능성이 제기된다. 미국에서는 구글의 영상 모델 ‘베오3(Veo 3)’가 이러한 기술 격차를 처음으로 좁힌 사례로 평가됐으며 이 모델의 영향으로 구글 랩스(Google Labs) 트래픽도 증가해 순위가 36위에서 25위로 상승했다.
주목되는 점은 오픈AI의 영상 모델 ‘소라(Sora)’가 이번 모바일 목록에 포함되지 않았다는 점이다. 오픈AI는 2025년 9월 소라 2.0을 독립 애플리케이션 형태로 출시했으며 사용자가 자신의 디지털 얼굴을 ‘카메오(Cameo)’로 업로드해 실제 인물이 등장하는 영상을 생성할 수 있도록 했다.

소라는 출시 직후 미국 앱스토어 1위를 20일 동안 유지했고 챗GPT보다 빠르게 100만 다운로드를 기록했다. 그러나 이후 다운로드 증가 속도는 둔화됐다. AI 영상 서비스가 소셜 플랫폼처럼 폭발적으로 확산되는 단계에는 아직 도달하지 못했기 때문이다.
그럼에도 소라는 여전히 상당한 사용자 기반을 유지하고 있다. 센서타워(SensorTower)에 따르면 현재 모바일 기준 소라의 일일 활성 이용자는 약 300만 명 수준으로, AI 영상 제작자들이 생성한 콘텐츠를 다른 플랫폼에 게시하면서 계속 활용되고 있는 것으로 나타났다.
음악과 음성 분야는 상대적으로 안정적인 시장을 유지하고 있다. 음악 생성 서비스 수노(Suno)는 이번 조사에서도 15위를 유지했으며 이전 조사와 동일한 순위를 기록했다.
음성 AI 기업 일레븐랩스(ElevenLabs)는 2023년 9월 이후 모든 조사 목록에 꾸준히 포함됐다. 음성 복제, 더빙, 오디오 제작 등 전문 기능이 여전히 독립적인 서비스 경쟁력을 유지하고 있기 때문이다.
이러한 흐름은 생성형 AI 시장의 구조적 패턴을 보여준다. 구글과 오픈AI 같은 대형 AI 기업이 집중적으로 투자하는 영역에서는 독립형 서비스의 트래픽이 줄어드는 경향이 나타났다. 이미지 생성이 대표적인 사례이며 영상 생성 분야도 점차 같은 흐름이 나타날 가능성이 있다.
반면 대형 AI 기업의 집중도가 상대적으로 낮은 음악과 음성 분야에서는 여전히 독립 서비스가 성장할 여지가 남아 있는 것으로 분석됐다.




