영상 생성 AI 스타트업 루마AI(Luma AI)가 차세대 모델 'Ray3'을 공개하며 영상 제작 시장에 한층 진보된 기술력을 선보였다. 이번에 출시된 Ray3는 텍스트 명령을 기반으로 고해상도 시네마틱 영상을 제작할 수 있는 생성형 AI 모델로, 기존 모델보다 두 배 향상된 데이터 처리 규모는 물론, 이성과 추론 능력까지 내장해 창작 작업에 혁신을 예고하고 있다.
루마AI의 공동 창업자이자 최고경영자인 아밋 제인(Amit Jain)은 "Ray3는 창작이라는 인간의 가장 복잡한 지적 활동을 AI가 모방하도록 설계된 첫 번째 단계"라고 밝혔다. 기존의 일반적인 생성형 비디오 모델들이 단순히 입력을 출력 결과로 바꾸는 수준이었다면, Ray3는 장면 설명을 실제 영상 구상으로 '사고'한 후 결과물을 도출하는 사고의 사슬(chain of thought) 구조를 채택했다.
이 모델은 영상 제작 과정을 애니메이터나 영화감독처럼 스토리보드를 제작하는 방식으로 진행한다. 사용자와의 협업이 가능한 구조로 되어 있어, 사용자의 피드백이나 이미지 주석(annotation)을 반영해 영상 수정이 가능하며, 여러 단계를 거쳐 복잡한 장면까지 구현할 수 있다. 특히 영상 초안에 손으로 그은 선 같은 시각적 주석까지 이해할 수 있어, 세밀한 창작 방향 제시가 한층 수월해졌다.
기술적인 측면에서 Ray3는 업계 표준 이상의 고성능을 자랑한다. 'ACES2065-1' 포맷을 기반으로 10비트, 12비트, 16비트의 트루 HDR 영상 생성을 지원하며, 기존 일반 영상(SDR)도 고화질 HDR로 실시간 전환이 가능하다. 어두운 장면은 밝게, 색은 왜곡 없이 선명하게 조정할 수 있어 전문 광고 및 영상 제작자들에게 이상적인 툴로 평가받고 있다.
영상 생성 길이는 최대 10초까지 지원되며, 사용자는 텍스트뿐 아니라 이미지 기반 생성도 가능하다. 이미지에 텍스트 주석을 추가하면 더욱 명확한 연출 의도를 반영할 수 있어, 장면 간 시각적 일관성을 유지한 다중 장면 생성도 이전보다 흠잡을 데 없이 자연스럽게 구현된다.
루마AI는 이번 'Ray3' 출시와 함께 어도비(Adobe)와 전략적 파트너십을 체결했다. 어도비의 생성형 AI 기반 앱 파이어플라이(Firefly)에 Ray3의 기능이 통합되면, 디자이너와 영상 전담자들이 기존보다 훨씬 직관적으로 고품질 영상을 제작할 수 있을 것으로 기대된다.
또한 일본의 대형 디지털 마케팅 기업 덴츠 디지털(Dentsu Digital)은 Ray3를 콘텐츠 제작 파이프라인에 도입할 계획이며, 크리에이티브 에이전시인 몽크스(Monks), 스트로베리프로그(StrawberryFrog) 등도 Ray3 채택을 공식화했다. 사우디아라비아의 AI 기업 휴메인(Humain) 역시 Ray3 통합을 추진 중으로, 현지 콘텐츠 산업의 디지털 전환에서 핵심 도구로 활용될 전망이다.
휴메인의 전략 책임자 스티브 플림솔(Steve Plimsoll)은 “Ray3는 단순한 업그레이드가 아니라 도약 수준의 기술 진보”라며 “언어, 이미지, 모션 전반에 걸쳐 AI가 사고함으로써 창작의 품질과 속도는 물론 윤리와 문화 규범까지 아우를 수 있게 된 점이 핵심”이라고 강조했다.
AI와 영상 기술의 융합이 가속화되는 가운데, 루마AI의 Ray3는 영상 기반 크리에이티브 산업에 강력한 새 시대의 서막을 열고 있다. creativity와 AI의 경계가 흐려지는 지금, Ray3는 그 홈 경계선을 새롭게 그려나가고 있다.