오픈AI가 자사의 대표 추론 특화 대형 언어 모델 ‘o3’의 이용 요금을 대폭 인하하며 개발자들을 위한 진입 장벽을 낮췄다. 이번 가격 조정은 입력 및 출력 토큰당 요금을 각각 80%씩 내리는 파격적인 조치로, 경쟁 모델인 구글 딥마인드의 ‘제미니 2.5 프로’와 앤스로픽의 ‘클로드 오퍼스 4’ 등과의 가격 경쟁력을 확보하려는 전략으로 풀이된다.
샘 알트먼(Sam Altman) 오픈AI 최고경영자(CEO)는 본인의 X(구 트위터) 계정을 통해 해당 사실을 직접 공개하며 “더 많은 실험이 이뤄지길 바라는 마음”이라고 밝혔다. 인하된 가격은 백만 개의 입력 토큰당 2달러(약 2,880원), 출력 토큰당 8달러(약 1만 1,520원)로, 기존에 각각 10달러(약 1만 4,400원), 40달러(약 5만 7,600원)였던 것에 비해 상당히 낮아졌다. 여기에, 사용자 입력이 이전과 동일해 캐시에 저장된 경우엔 입력 토큰당 추가로 0.50달러(약 720원)의 할인까지 제공된다.
이번 조치로 인해 o3는 개발 초기 단계의 스타트업이나 소규모 연구 조직, 그리고 개인 개발자들에게 더욱 매력적이고 현실적인 모델로 부상할 가능성이 높아졌다. 특히 API와 플레이그라운드를 통해 몇 달러 단위의 소액 잔고만으로도 모델을 활용할 수 있어 프로토타입 제작이나 제한된 자원으로 실험하는 경우에 유리한 조건을 제공한다.
경쟁 모델들과의 가격 비교에서도 o3의 경쟁력은 두드러진다. 예컨대 구글 딥마인드의 제미니 2.5 프로는 입력 토큰당 1.25~2.50달러, 출력 토큰당 최대 15달러 수준이며, 앤스로픽의 클로드 오퍼스 4는 입력당 15달러, 출력은 75달러에 달한다. 반면 중국계 AI 기업 딥시크의 딥시크-리져너 및 딥시크-챗 등은 더 공격적인 저가 모델로 분류된다. 이들은 평균 입력당 0.07~0.55달러, 출력당 1.10~2.19달러 수준이며, 야간 시간대 캐시 기반으로는 가격이 더욱 저렴하게 책정된다.
오픈AI는 여기에 추가로 유연 처리 모드를 제시하며 입력당 5달러, 출력당 20달러 과금 구조의 ‘플렉스 모드’도 도입했다. 이는 연산속도나 수요 패턴에 따라 비용과 지연시간을 조절하고자 하는 개발 수요에 대응하기 위한 것이다.
독립 분석 기관인 ‘Artificial Analysis’에 따르면 o3로 벤치마크 테스트 전체를 수행하는 비용은 390달러(약 56만 1,600원)로, 제미니 2.5 프로의 971달러(약 139만 8,240원), 클로드 4 소네트의 342달러(약 49만 2,480원)보다 저렴한 편이다. 이는 성능 대비 가격 효율성 면에서 o3의 매력을 부각시키는 결과다.
결국, 오픈AI의 이번 요금인하는 생성형 AI 시장에서 ‘고성능=고가’라는 기존의 등식에 큰 변화를 예고하는 신호탄이라 할 수 있다. 경제적 접근성과 성능 사이의 간극을 좁히며, 추론 중심 모델 개발의 진입 장벽을 낮추는 움직임이 가속화될 전망이다.