OpenAI, 비즈니스용 AI 에이전트 본격 확대…Responses API로 업무 자동화 선도

| 김민준 기자

기업용 AI에 대한 OpenAI의 접근 방식이 점점 구체화되고 있다. 오픈AI API 플랫폼 총괄 올리비에르 고드망은 최근 열린 'VB 트랜스폼 2025' 행사에서 기업들이 AI 에이전트를 실제 비즈니스 환경에 어떻게 적용하고 있는지를 상세히 밝혔다. GPT-3 출시 이후 5년, AI 기술은 더 이상 실험적 개념이 아닌 현실적인 생산 도구로 자리를 잡고 있다는 평가가 나온다.

현재 OpenAI API 플랫폼은 전 세계적으로 월 100만 명 이상의 개발자가 사용하는 상황까지 성장했다. 플랫폼에서의 토큰 사용량은 전년 대비 무려 700% 이상 증가했다는 수치도 공개됐다. 고드망은 "이제 AI는 단순 대화형 챗봇을 넘어, 실제 업무를 수행할 수 있는 '에이전트'로 행동하고 있다"며 이 같은 변화가 Responses API와 Agents SDK 개발의 계기가 됐다고 설명했다.

특히 Responses API는 기존의 모델 호출 흐름을 개발자가 직접 설계해야 했던 방식에서 벗어나, 목적 중심의 응답을 생성할 수 있도록 지원하는 계층형 툴로 평가받는다. 기업 입장에서는 검색, 기능 호출, 지식 검색 등 복잡한 흐름을 하나의 명령어로 단순화할 수 있는 이점이 있다. 고드망은 "Responses API는 GPT-3 이후 가장 중요한 아키텍처의 변화"라며, 이 툴이 기업용 AI 에이전트의 표준이 될 것이라고 강조했다.

에이전트 구조의 설계 방식도 많은 관심을 모았다. 하나의 에이전트가 모든 기능을 처리하는 단일 구조는 구상은 단순하지만 현실에서는 효율성이 떨어진다. 이에 고드망은 '서브 에이전트'라는 다중 구조 방식을 소개했다. 이는 각각의 서브 에이전트가 특정 업무나 책임을 맡는 소형팀처럼 작동하며, 기업 내부에서 이미 널리 채택되고 있는 모델이다.

보안과 컴플라이언스 역시 핵심 의제로 다뤄졌다. OpenAI는 현재 금융·의료 등 고규제 산업을 위한 보안 기준으로 정책 기반 거부 기능, SOC-2 수준 로깅, 데이터 지역화 지원 등을 갖추고 있다. 특히 실제 배포 단계에서 가장 큰 병목으로 지목된 것은 모델 평가 도구였다. 고드망은 "정확성과 신뢰성을 입증하지 못하면 도입 장벽은 여전히 높다"며, 새로운 평가 및 추적 기능의 중요성을 재차 강조했다.

초기 도입 기업들의 성과도 눈에 띄었다. 결제 플랫폼 스트라이프는 에이전트를 통해 송장 처리 속도가 35% 빨라졌으며, 파일 공유 서비스 박스는 '무인 티켓 분류' 기능을 통해 고객지원 효율을 높였다. 이 외에도 음성 기반 고객 지원, 내부 규정 준수, 복잡한 문서 탐색을 지원하는 지식 어시스턴트 등이 주요 활용 사례로 소개됐다.

고드망은 성과를 낸 초기 프로젝트들 대부분이 '기술에 열광하고 문제 해결에 집착하는' 소수의 인재들에 의해 주도된 것이라고 말했다. 이들은 반드시 개발자 출신일 필요는 없지만, 기술 수용력과 실행력이 높다는 공통점이 있다. 그는 "실제 업무 전문성은 엔지니어가 아닌 운영 부서에 있다"며, 이들이 직접 AI 에이전트를 설계할 수 있도록 도구를 더 직관적으로 개선하겠다는 계획도 밝혔다.

향후 로드맵도 분명히 제시됐다. 현재 OpenAI는 텍스트, 음성, 이미지, 구조화 데이터를 모두 활용할 수 있는 '멀티모달 에이전트'와 장기간 기억이 가능한 모델, 클라우드 간 연동이 가능한 작업 환경까지 개발 중이다. 이는 기존 모델의 성능을 점진적으로 확장하는 방향이다. 고드망은 "AI가 몇 분, 몇 시간 단위로 사고할 수 있게 되면 가능성은 지금보다 훨씬 커진다"고 전망했다.

마지막으로 그는 "이성적 사고와 판단을 가능하게 하는 '추론형 모델'의 가능성은 아직 과소평가되고 있다"고 강조했다. 지금의 기술은 GPT-2에서 GPT-3로 넘어가는 초기 수준이라는 것이다. 기업이 이 기술을 활용해 실질적인 성과를 얻기 위해선 멋진 데모가 아니라, 업무 현장에 맞는 '지속 가능한 시스템'을 만들어야 한다는 현실적인 조언도 덧붙였다.