GPT-5 기반의 인공지능(AI)이 암호화폐 자동 거래 대회에서 사실상 ‘전액 손실’ 수순을 밟으며 시장 예측 역량에 대해 도마에 올랐다. 가장 진보된 범용 대형 언어모델로 평가받는 GPT-5가 실전 트레이딩에서는 참패한 셈이다. 전문가들은 텍스트 생성이나 추론 능력과 실전 시장 대응 능력은 전혀 다르다는 점을 강조하고 있다.
코인글래스(CoinGlass)가 집계한 ‘AI 모델 트레이딩 리더보드’에 따르면, GPT-5는 실전 거래에서 -64.22%에 달하는 손실을 기록하며 출전 모델 중 최하위를 차지했다. 총 손실액은 6,367달러(약 886만 원)에 달하며, 기록된 경쟁 모델 중 가장 빠르고 가파른 가치 하락세를 보였다. 반면, 그록(Grok)이나 딥시크(DeepSeek)와 같은 일부 AI 모델은 각각 +3%, +64%의 수익을 기록해 GPT-5와 뚜렷한 대조를 보였다.
이러한 결과는 대형 언어모델(LLM)이 텍스트 생성, 문맥 이해, 문제 해결에는 탁월할지 몰라도, 고빈도 데이터 해석과 순간적 시장 대응이 요구되는 거래에는 부적합하다는 점을 상기시킨다. 특히 암호화폐처럼 극단적인 변동성이 일상인 시장에서는, 정적 학습 데이터에 기반한 범용 AI로는 실시간 분석과 주문북 해석, 리스크 관리 등에서 경쟁력을 갖기 어렵다는 분석이 나온다.
전문가들은 현재 GPT-5와 같은 범용 언어모델은 ‘금융 시장의 전략가’가 아닌 ‘도박꾼’에 가깝다고 지적한다. 헤지펀드와 대형 자산운용사가 사용하는 전문 AI는 실시간 데이터 학습과 특정 전략에 맞춘 도메인 특화 모델로, 국내에서도 주요 금융사들이 이와 같은 방식의 알고리즘 강화를 추진 중이다.
AI 트레이더 성과가 우연에 가까운 ‘무작위 결과’에 그친다는 점 역시 지적된다. 특정 환경에서는 일시적 수익이 발생할 수 있지만, 이는 단기 변동성에 의한 착시일 뿐 일관된 전략이나 실적에 기반한 수익이라 보기 어렵다는 것이다. GPT-5처럼 지나친 패턴 추종으로 방향성 판단이 틀리면, 손실은 걷잡을 수 없는 수준으로 증폭될 수 있다.
현재로서는 GPT-5와 같은 대형 언어모델에 암호화폐 지갑이나 실거래를 맡기는 것은 극히 신중해야 할 선택이라는 평가가 지배적이다. AI는 텍스트 분석과 정보 요약에는 유용한 도구일 수 있으나, 시장을 예측하고 리스크를 통제하는 데 있어선 아직 사람보다 못한 것으로 보인다. 고성능으로 포장된 기술이 ‘시장 플레이어’가 되는 데는, 여전히 많은 숙제가 남아 있다.