NC소프트의 인공지능 연구조직인 'NC AI'가 게임 및 엔터테인먼트 분야에 특화된 괴물 음성 생성 기술을 세계 최대 음성·언어 기술 학회에서 선보이기로 했다. 해당 기술은 인공지능 기반 음색 변환을 통해 실제 게임 제작 현장에서 요구되는 몬스터 사운드를 자동으로 만들어내는 것이 특징이다.
이번에 공개되는 기술은 오는 8월 17일부터 21일까지 네덜란드 로테르담에서 열리는 ‘인터스피치 2025(InterSpeech 2025)’에서 최초로 발표된다. 해당 학회는 국제 음성커뮤니케이션협회(ISCA)가 주최하는 세계 최대의 음성 및 언어 기술 행사로, 매년 세계 각국의 연구기관과 기업들이 첨단 연구 성과를 공유하는 자리다.
NC AI는 이번 행사를 통해 몬스터 사운드에 특화된 음색 변환 모델의 구조와 학습 방식을 담은 논문과, 이를 실제 웹 기반 데모 시스템으로 구현한 기술 사례를 담은 논문 등 총 2편을 공개할 예정이다. 해당 기술은 사용자의 음성 입력을 실시간으로 몬스터의 포효, 웃음, 숨소리 등 다양한 비언어적 표현으로 바꿀 수 있는 복합 음향 변환 기능을 갖췄다.
NC소프트는 이 기술을 위해 자사 사운드센터와 공동으로 수년간 구축해온 방대한 게임 오디오 데이터를 활용했다. 이 데이터는 음색, 배경 잡음(노이즈), 분위기 등 세분화된 기준에 따라 정밀하게 분류돼 학습에 활용됐으며, 이를 통해 기존에는 사운드 디자이너가 직접 제작하던 복잡한 몬스터 음향 작업을 줄이고 효율을 높일 수 있게 됐다는 설명이다.
현장에서는 관람객이 마이크로 자신의 음성을 입력하면 인공지능 모델이 즉시 특정 몬스터의 음색으로 바꾸어주는 체험형 데모도 운영된다. 별도로 마련된 온라인 데모 페이지에서도 같은 경험이 가능해, 개발자뿐 아니라 일반 사용자들도 기술의 원리를 쉽게 이해할 수 있게 구성됐다.
이 같은 기술 흐름은 앞으로 게임 제작뿐 아니라 가상 현실, 영화, 애니메이션 등 다양한 디지털 엔터테인먼트 분야에서 고품질 음향 효과 구현을 자동화하고, 제작 비용 절감과 개발 시간 단축이라는 두 마리 토끼를 잡는 데 기여할 수 있을 것으로 기대된다.