IBM은 Deepgram과 협력하여 Deepgram의 음성 기술을 IBM의 watsonx Orchestrate 플랫폼에 통합할 예정이다. 이 협업을 통해 Deepgram은 IBM의 첫 번째 음성 기술 파트너로 자리하게 된다.
이번 협약에 따라 Deepgram의 음성 인식 및 변환 기술이 IBM의 인공지능 에이전트와 자동화된 워크플로우를 구축하고 관리하는 플랫폼에 내장된다. 이는 기업 수준의 전사적 트랜스크립션과 실시간 자막 기능, 그리고 자연스러운 음성 대화 기능을 디지털 에이전트에 제공하기 위한 것으로 전해진다.
양사는 이번 협력이 고객 지원, 콜 분석, 음성 기반 데이터 입력 등 다양한 분야에서 실시간으로 음성을 지원하는 에이전트와 워크플로우를 구축할 수 있는 기반을 마련할 것이라고 설명했다. 이는 소프트웨어 에이전트와의 상호작용을 단순화하고자 하는 기업의 요구를 반영한 것이다. Grand View Research Inc.는 음성 및 음성 인식 시장 규모가 2023년 202억 달러(약 29조 5680억 원)에서 2030년까지 연평균 15% 성장할 것으로 예상하고 있다.
Deepgram의 기술은 잡음, 다양한 악센트, 현실 대화와 같은 문제를 해결하는 데 중점을 두고 있다. 35개 언어를 지원하며, 여러 아랍어 및 인도 변형 언어를 포함하고 있다. Deepgram은 300밀리초 미만의 지연 시간으로 90% 이상의 정확도를 제공한다.
이 통합 작업은 watsonx의 기능을 확장하는 것이며, watsonx는 AI 모델 구축, 훈련, 관리 도구와 비즈니스 프로세스를 통한 AI 에이전트 오케스트레이션 기능을 포함한다. IBM은 watsonx를 하이브리드 클라우드 환경과 통합된, 개방적이고 기업 중심의 AI를 전달하는 핵심 요소로 위치시키고 있다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>