오픈AI(OpenAI)가 새로운 대형 언어모델 GPT-5.2를 공식 발표하며 AI 기술의 또 한 번의 진화를 예고했다. GPT-5.2는 세 가지 버전으로 출시됐으며, 그중 ‘Thinking’과 ‘Pro’는 수학 문제 해결 능력에서 역대 최고 성능을 기록해 업계의 주목을 받고 있다.
GPT-5.2 Thinking 버전은 대학 수준의 수학 문제로 구성된 FrontierMath(1~3단계) 벤치마크 테스트에서 정확률 40.3%를 기록하며 업계 신기록을 달성했다. 이 데이터셋은 일부 문제의 경우 대학원생도 몇 시간씩 소요되는 고난도이며, GPT-5.2는 해당 시험에서 국제수학올림피아드 자격시험 만점이라는 성과도 올렸다. 최상위 모델인 GPT-5.2 Pro는 통계학의 한 갈래인 ‘통계 학습 이론’ 분야에서 2019년 수학 학회에서 제기된 미해결 문제의 단순화 버전을 인간의 도움 없이 스스로 해결해 내며 AI의 자율적 추론 능력을 입증했다.
비단 수학 문제 해결에 국한되지 않는다. GPT-5.2는 이전 버전 GPT-5.1 대비 과학 논문 속 도표 해석 능력에서도 개선됐다. CharXiv Reasoning 벤치마크 기준, Thinking 버전은 도표 해석에서 88.7%의 정확도를 기록하며 GPT-5.1보다 8% 이상 향상됐다. 시각적 추론 기능을 강화한 덕분에, 저해상도 메인보드 이미지를 통한 부품 식별이나 기업 대시보드 분석, 제품 도해 해석 등에 걸쳐 실효성이 확대됐다는 것이 오픈AI 측 설명이다.
프론트엔드 UI 설계, 3D 시뮬레이션 제작에도 강점을 발휘했다. GPT-5.2는 시각 기반 코드 작성 능력에서 우수한 성능을 보이며 복잡한 소프트웨어 설계에서도 활용 가능성을 넓혔다. 특히 SWE-Bench Pro에서 55.6%의 정답률을 보이며 다언어 코딩 문제 해결 분야에서도 업계 최고 수준을 달성했다. 파이썬 전용 버전 SWE-Bench Verified에선 80%에 달하는 정확도를 보였다.
GPT-5.2는 이날부터 챗GPT(ChatGPT) 플랫폼에 탑재되어 일부 사용자들을 통해 순차적으로 배포 중이다. 기존과 마찬가지로 API 형태로도 사용 가능하며, 개발자들이 적용할 수 있도록 다양한 툴과 설정 기능이 함께 제공된다. 가장 기본형 모델은 백만 개 입력 토큰당 1.75달러(약 2,520원), 출력 토큰당 14달러(약 2만1600원) 수준이다. Pro 버전은 각각 21달러(약 3만2400원), 168달러(약 24만1920원)로 책정됐지만, 빈번하게 반복되는 응답을 캐시에 저장해 최대 90%의 비용을 절감할 수 있는 기능도 함께 제공된다.
GPT-5.2는 단순 성능 제고를 넘어, 인간 전문가에 가까운 추론과 자율적인 문제 해결 능력을 보여주면서 생성형 AI 기술의 지평을 확장하고 있다. 특히 수학, 과학, 컴퓨팅 분야에서 GPT-5.2의 실증적 역량이 확인되면서, 향후 고등 교육, 연구 기관, 산업 자동화 등 다양한 분야에서의 직접적인 적용 사례가 빠르게 늘어날 것으로 보인다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>