AI, 암호화폐 트레이딩 실전 테스트…딥식·클로드 수익률 '10%'로 선두

| 손정환 기자

암호화폐 트레이딩에 인공지능(AI)이 얼마나 효과적인지를 가늠할 수 있는 이례적인 실험이 소셜미디어를 통해 화제를 모으고 있다. 이름난 AI 모델 6종이 동일한 자금으로 실전 테스트에 나섰고, 초반 성적이 공개되며 향후 성능 경쟁에 대한 기대감도 커지고 있다.

이번 실험은 AI 연구소 Nof1이 주관하는 ‘알파 아레나(Alpha Arena)’라는 이름의 챌린지로, 각 모델마다 1만 달러(약 1,390만 원)의 초기 자금을 배정받아 하이퍼리퀴드(Hyperliquid) 플랫폼에서 자체 계정을 통해 트레이딩 전략을 구사하도록 구성돼 있다. 참가한 AI는 GPT-5, 그로크(GROK 4), 클로드 소넷(Claude Sonnet 4.5), 제미니 2.5 프로(Gemini 2.5 PRO), 딥식 챗 v3.1(DeepSeek Chat v3.1), QWEN3 MAX까지 총 여섯 개다. 모든 거래는 온체인으로 검증 가능하며, 실현 손익(P&L)만 공개된다.

실험 4일째 기준, 가장 두각을 나타내는 모델은 딥식과 클로드로 각각 포트폴리오 수익률 약 10%를 기록하며 선두를 달리고 있다. 딥식은 특히 롱 포지션 중심의 전략을 구사하고 있는데, 최근 트레이딩 내역 중 다섯 번은 롱, 한 번만 숏이었다. 대표적인 수익 사례로는 리플(XRP)을 2.29달러에 매수해 2.45달러에 정리해 약 1,500달러(약 208만 원)의 순이익을 거둔 거래가 있다.

반면 시장이 최근 24시간 동안 조정세를 보이며 비트코인(BTC) 가격이 약 3.5% 하락함에 따라 롱 중심의 모델 성능은 다소 누그러진 모습이다. 이는 하이퍼리퀴드 대시보드에서 실시간으로 드러나며, AI 모델의 시장 적응력에 대한 평가가 본격적으로 이뤄지는 지점이기도 하다.

이번 챌린지의 특징은 단순한 알고리즘 트레이딩이 아닌, 범용 AI 모델들이 각자의 논리를 기반으로 매매에 접근한다는 점이다. 다만 대시보드에서는 구체적 매수·매도 판단의 이유는 비공개이며, 출구 전략만 확인할 수 있다. 현재까지 관찰된 바에 따르면, 기술적 지표 중 이동평균선(MA), MACD 등 전통적인 분석 도구들이 널리 활용되고 있는 것으로 보인다.

흥미로운 점은 각 AI의 성향이 뚜렷히 드러나고 있다는 사실이다. 예를 들어, 제미니는 8건의 트레이드 중 단 한 건만 수익을 냈는데, 이 거래에서 무려 18,076달러(약 2,511만 원)의 이익을 기록했다. 그러나 나머지에서 손실이 발생하면서 전체적으로 약 4,000달러(약 556만 원) 마이너스 실현 손익을 기록 중이다. 반면, 챗GPT는 최근 25건의 트레이드 중 수익을 낸 사례가 전무한 상태다.

특히 눈에 띄는 변화는 그로크에서 발생했으며, 며칠 전까지 전면 롱 전략으로 큰 폭의 랠리를 이끌었으나, 시장 조정과 함께 대부분의 수익을 반납하며 순위가 급락했다. 이처럼 환경 변화에 얼마나 유연하게 대응할 수 있는지가 모델 간 성능 격차에 영향을 미치고 있다.

Nof1은 이번 실험을 시작으로 AI 트레이딩의 ‘리그화’를 본격 추진할 계획이다. 향후 시즌에는 인간 트레이더와 자체 개발 AI 모델도 포함될 예정이라고 밝혀, 업계 관심이 더욱 집중될 전망이다. AI가 금융시장에서 어떤 방식으로 진화하고 있는지 보여주는 이번 챌린지는 불확실성의 암호화폐 시장에서 새로운 ‘지표’가 될 가능성을 보여준다.