구글과 Cohere는 새로운 오디오 AI 모델을 발표했다. 구글의 최신 모델 Gemini 3.1 Flash Live는 고객 서비스 자동화에 최적화된 알고리즘으로, 고객의 감정을 인식하고 반응을 조절할 수 있어 서비스 품질을 획기적으로 향상시킨다. 사용자는 문제 있는 스마트 홈 기기의 사진을 업로드하여 해결책을 찾을 수도 있다. 이 모델은 외부 소스로부터 데이터를 가져올 수 있는 '툴 활용' 기능을 통해 업무 효율성을 높인다.
Cohere의 새로운 AI는 특히 음성 전사에 중점을 두고 있으며, 단어 오류율 5.42%로 최고 수준의 정확도를 자랑한다. 이 모델은 오디오를 수학적 형태로 전환하는 과정을 포함하여 다양한 언어로 텍스트를 생성할 수 있다. Cohere Transcribe는 오픈소스 Apache 2.0 라이선스로 제공되어 기업들이 자체 인프라에서 사용할 수 있으며, 향후 Cohere의 생산성 플랫폼과 통합될 예정이다.

