구글(GOOGL)이 개발한 인공지능(AI) 모델이 세계 최고 권위의 국제 수학올림피아드(IMO)에서 금메달을 획득하며 AI의 수리 추론 능력이 한 단계 진화했다는 평가를 받고 있다. 구글 딥마인드(DeepMind)가 공개한 이 소식은 오픈AI(OpenAI)가 비슷한 성과를 발표한 지 이틀 만에 전해졌지만, 평가 방식에서는 뚜렷한 차이를 보인다. 구글 AI는 실제 인간 참가자들과 동일한 채점 기준을 거쳤지만, 오픈AI는 IMO 참가자 출신들의 주관적 평가를 통해 금메달 등급을 인정받았다.
IMO는 전 세계 고등학생들이 국가 대표로 참가해 난이도 높은 문제를 제한 시간 내 풀어야 하는 대회로, 올해는 630명의 참가자 중 67명만이 금메달을 획득할 정도의 난이도를 자랑했다. 출제 영역은 고교 수준의 대수학, 조합론, 기하학, 정수론에 기반하지만, 정답 도출을 위해 몇 장 분량의 수학적 증명과 논리를 요구하는 고차원적 문제들이 출제된다.
구글이 이번에 활용한 AI는 자사의 제미니(Gemini) 대형 언어모델(LLM) 기반 알고리즘으로, 지난 5월 처음 공개된 ‘딥 띵크(Deep Think)’ 기능을 포함한다. 이 기능은 하나의 정답 대신 복수의 접근법과 해법을 동시에 생성하고 이를 통합해 최적의 답안을 도출하는 데 초점을 맞춘 기술이다. 특히, 강화학습 기법을 통해 수많은 수학 문제 풀이 과정을 학습하고 피드백에 기반해 정확도를 정교하게 개선했다.
학습 데이터 또한 차별화됐다. 단순한 해답 모음이 아닌, 각 문제를 해결하는 데 필요한 중간 단계와 해법 접근법에 대한 설명, IMO 스타일 응용 팁까지 포함된 고품질 수학 콘텐츠로 구성됐다. 그 결과, 이 AI는 6문제 중 가장 까다로운 마지막 한 문제를 제외한 5문제에서 정답을 맞히며 금메달을 따냈다. 특히 마지막 문제는 전체 630명의 인간 참가자 중 단 5명만 해결할 만큼 높은 난이도를 자랑했다.
지난해에는 두 개의 구글 AI 모델이 각각 기하학과 증명 생성 능력을 특화시켜 공동으로 은메달을 획득한 바 있다. 당시 모델들은 자연어를 수학 언어로 번역하고 되돌리는 복잡한 과정을 거쳐야 했던 데 반해, 제미니는 처음부터 끝까지 자연어 기반 문제만으로 수학 증명을 생성하며 시간과 컴퓨팅 비용도 크게 줄였다.
구글은 향후 이 AI 모델을 단계적으로 공개한다는 계획이다. 우선 소수의 수학자 그룹을 대상으로 테스트에 나선 뒤, 고급 사용자용 유료 AI 서비스 구글 AI 울트라(Google AI Ultra)에 통합할 방침이다. 이 구독 상품은 연 $250(약 36만 원)에 제공되며, 제미니 기반 고도화 기능과 함께 다수의 AI 플랫폼 서비스에 접속할 수 있도록 설계됐다.
AI 기술이 학문적 영역에서도 인간의 사고력을 넘볼 만큼 발전하면서, 단순 챗봇을 넘는 이성 추론형 AI의 시대가 본격화되고 있다는 전망이 나온다. 업계에서는 구글과 오픈AI의 수학 경합이 향후 더 복잡한 문제 해결로 확장되며, 과학과 교육 전반의 패러다임 전환을 예고하고 있다고 본다.