2024년 설립된 음성 AI 스타트업 스몰리스트.ai(Smallest.ai)가 최근 시드 투자를 통해 800만 달러(약 115억 원)를 유치했다. 이번 투자는 시에라 벤처스가 주도했으며, 3one4 캐피탈과 베터 캐피탈 등도 참여했다. 스몰리스트.ai는 텍스트를 음성으로 전환하는 기술을 개발하는 데 집중하고 있으며, 이번 투자로 유통, 헬스케어, 기술 산업을 중심으로 시장 확대에 나설 예정이다.
스몰리스트.ai는 로버트 보쉬 출신 공학자 수다르샨 카마스(Sudarshan Kamath) CEO와 악샤트 맨들로이(Akshat Mandloi) CTO가 공동 창업한 기업이다. 이들이 내놓은 대표 기술은 ‘라이트닝(Lightning)’이라는 음성 생성 알고리즘으로, 경쟁 모델보다 50배 빠른 속도로 텍스트를 음성으로 바꾼다는 점에서 주목받고 있다. 라이트닝은 단 100밀리초에 10초 분량의 음성을 생성할 수 있으며, 이처럼 빠른 속도는 기존 음성 모델이 하나의 토큰씩 차례로 음성을 생성하는 오토리그레시브 방식과 달리, 여러 토큰을 동시에 처리하는 방식으로 설계됐기 때문이다.
효율적인 하드웨어 활용도 눈에 띈다. 라이트닝 모델은 1GB 이하의 VRAM(그래픽카드 내장 메모리)만으로도 작동이 가능하도록 설계됐으며, 이는 불필요한 가중치를 제거하고 핵심 구성만 압축한 결과다. 스몰리스트.ai는 빠른 처리 속도에 더해 보안성과 적용 유연성을 갖춘 점을 차별화 포인트로 내세우고 있다. 기업 고객은 회사의 기술을 온프레미스 환경에 설치할 수도 있어, 금융·보안 등 고도화된 통제가 필요한 산업에도 확장 가능성이 크다.
이 회사는 지난달 말 ‘일렉트론 v2(Electron v2)’라는 최신 음성 모델도 출시했다. 이 모델은 최초 응답까지 걸리는 시간이 53.25밀리초로, 고객 응대 등 초저지연이 요구되는 환경에 적합하다. 40억 개 이상의 파라미터를 토대로 구성됐지만, 대형 모델들과 맞먹는 음성 품질을 제공하며, 더욱 섬세하고 자연스러운 대화를 구현할 수 있다.
사용자 맞춤화 기능도 강화됐다. 스몰리스트.ai는 15초 분량의 샘플 음성만으로 화자의 목소리를 복제할 수 있는 기술과, 최대 45분 분량의 고품질 음성 클론 방식도 함께 제공하고 있다. 여기에 산업별 특화 음성 에이전트를 개발할 수 있도록 지원함으로써, 고객사들은 신용카드 번호 안내 등 특정 업무에 최적화된 응답 시스템을 구축할 수 있다.
CTO 악샤트 맨들로이는 “우리는 단순히 속도만이 아닌, 기업이 신뢰할 수 있는 음성 인터페이스를 제공하는 데 초점을 맞췄다”며 “자연스러운 언어 이해, 보안 가드레일, 감정 표현까지 모두 결합된 완성형 기술 스택을 갖췄다”고 밝혔다.
이번 투자를 통해 스몰리스트.ai는 기술 고도화와 동시에 시장 확대 전략에 속도를 높일 것으로 전망된다. 특히 현재 AI 음성 생성 시장이 챗GPT 등의 텍스트 기반 생성형 AI에서 음성 중심 인터페이스로 확장되는 흐름 속에서, 스몰리스트.ai는 기업 특화 음성 기술 부문의 핵심 주자로 부상할 가능성이 커지고 있다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>