챗GPT 개발사 오픈AI가 차세대 영상 생성 모델 소라 2(Sora 2)와 이를 기반으로 한 소셜 플랫폼 소라 앱을 공개하며 생성형 AI 시장에 다시 한 번 강력한 존재감을 드러냈다. 이번 신모델은 기존 알고리즘보다 복잡한 장면을 더 정밀하게 시뮬레이션할 수 있는 능력을 갖췄다는 점에서 주목된다.
오픈AI에 따르면 소라 2는 지난 해 나온 1세대 제품보다 물리 현상을 매우 정밀하게 묘사할 수 있도록 개선됐다. 예를 들어 체조 경기 영상이나 물 위에 떠있는 물체처럼 물리적 상호작용이 복합적인 장면도 실제와 유사하게 재현할 수 있다. 이전 모델들은 이처럼 복잡한 시뮬레이션에서 사물의 왜곡이나 비자연적인 움직임을 보였지만, 소라 2는 이러한 오류를 최소화하는 동시에 영상 품질 저하 없이 현실감을 더해 준다.
소라 2는 영상 생성뿐 아니라 오디오 생성 기능도 탑재해 한층 현실적인 콘텐츠 완성을 지원한다. 사용자는 다양한 언어의 음성과 효과음을 함께 생성할 수 있으며, 하나의 프롬프트 내에 복수 문장을 입력하거나 영상의 질감, 조명 반사, 카메라 장비의 특성까지 디테일하게 지정할 수 있다. 더욱이 텍스트 외에도 짧은 영상을 입력값으로 사용할 수 있어, 업로드된 인물이나 사물의 형상 및 움직임을 그대로 반영한 새 영상을 만들어내는 것이 가능하다.
이 기술은 즉각적으로 iOS 기반의 새로운 소셜 앱 소라 앱에 적용됐다. 이 앱은 사용자들이 생성한 영상을 공유하고 다른 사용자의 클립과 결합하거나 변형해 재구성할 수 있는 기능을 제공하며, 모든 결과물은 중앙 피드에 실시간으로 업데이트된다. 오픈AI는 사용자의 피드 노출 콘텐츠를 자연어로 직접 제어할 수 있도록 차세대 추천 알고리즘도 함께 적용했다.
이 앱은 현재 미국과 캐나다에서 초대 기반으로 제공되며, 조만간 글로벌 출시를 앞두고 있다. 향후에는 ChatGPT 통합과 개발자용 API 형태로도 제공될 예정이다. 특히 유료 사용자인 ChatGPT Pro 구독자는 고급 기능이 탑재된 ‘소라 프로 2’를 이용할 수 있게 될 전망이다.
이번 발표는 오픈AI가 영상 생성 AI 영역에서도 기술적 우위를 확보하고 있음을 보여주며, 텍스트 기반 모델에 이어 멀티모달 생성기술로의 확장을 본격화한다는 점에서 업계의 관심을 끌고 있다. AI 기반 콘텐츠 제작의 자동화가 점점 현실이 되어가는 가운데, 소라 2와 함께 오픈AI는 또 하나의 전략적 변곡점을 맞이한 셈이다.