사람처럼 대화하고 감정을 이해하는 인공지능 음성 동반자가 현실로 성큼 다가왔다. AI 스타트업 세서미AI(Sesame AI)가 22일(현지시간) 차세대 음성 기반 AI 기술과 웨어러블 기기 개발을 가속화하기 위해 2억 5,000만 달러(약 3,600억 원)의 시리즈B 투자를 유치했다고 밝혔다. 이 자금은 대화형 음성모델 고도화와 함께, 사용자가 착용 가능한 휴대형 디바이스 개발에 집중 투입될 예정이다.
세서미AI는 오큘러스 공동 창업자 브렌던 아이리브(Brendan Iribe)와 기술 전문가 안킷 쿠마르(Ankit Kumar)가 2023년에 설립한 기업이다. 이 회사는 기존의 음성 비서가 단편적인 응답만 제공하는 한계를 넘어, 사용자의 감정과 문맥을 이해하고 자연스럽게 대화하는 동반자형 AI를 표방하고 있다. 대표 개발 제품은 사용자의 일상 대화를 실시간으로 지원하며 개인 맞춤형 정보 제공이 가능한 '개인 에이전트(Personal Agent)'다.
세서미AI가 내세우는 기술적 강점은 ‘대화형 음성모델(Conversational Speech Model)’이다. 이 모델은 음성과 텍스트를 동시에 처리하며, 기존 음성비서의 '음성-텍스트 변환→답변 생성→다시 음성 출력'의 일방향 흐름과는 달리, 청각적 맥락과 언어적 의미를 결합해 200~300밀리초 수준의 신속한 반응속도를 구현한다. 덕분에 상대방의 말투, 감정, 논리 흐름까지 동시 반영할 수 있어 실제 사람과 대화를 나누는 듯한 자연스러운 사용 경험이 가능하다.
세서미는 이를 담는 하드웨어 역시 개발 중이다. 초경량 오디오 기반 안경형 웨어러블 기기로, 사용자가 하루 종일 착용하면서도 피로감 없이 AI와 대화를 지속할 수 있도록 설계됐다. 다만, AR이나 VR 기능은 배제하고 오직 음성 기반 인터페이스 최적화에 초점을 맞췄다. 이와 관련해 시장에서는 해당 제품을 '스마트 글라스'로 분류하긴 하지만, 현실 증강 기능이 빠진 점에서 차별점을 가진다.
아직까지 소비자용 제품은 출시되지 않았지만, 세서미는 최근 내부 구성원을 대상으로 한 사전 테스트 및 음성 페르소나 기반 데모 시스템을 공개했다. 이 시스템은 감정 반응이 가능하고 RPG 형식의 시나리오 기반 상호작용도 가능하다는 점에서, 기존 AI의 활용 한계를 뛰어넘은 것으로 평가된다.
이번 투자 라운드는 세쿼이아 캐피털 오퍼레이션(Sequoia Capital Operations)과 스파크 캐피털(Spark Capital Management)이 공동 주도했으며, 익명의 전략적 투자자들이 다수 참여한 것으로 알려졌다. 업계에선 세서미AI가 AI 음성 인터페이스의 새로운 표준을 제시할 수 있을지 여부에 주목하고 있다.
음성과 감정, 맥락을 모두 이해하는 ‘사람같은 AI’는 더 이상 공상과학의 영역이 아니다. 대세로 떠오른 초개인화 기술 흐름과 맞물려, 세서미AI가 제시하는 방향성이 앞으로 스마트 디바이스의 진화를 어떻게 견인할지 귀추가 주목된다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>