에이전트 대 에이전트(AvA) 게임과 예측시장을 결합한 도플 게임즈가 AI 에이전트 산업의 새로운 실험장으로 부상하고 있다. 메사리 리서치(Messari Research)의 오스틴 와일러(Austin Weiler)는 최근 보고서를 통해 도플 게임즈가 공개 인물 기반 AI 에이전트를 동일한 기본 거대언어모델 위에서 각각 별도 학습시키는 구조로 AvA 경쟁의 고질적 한계를 줄였고, Base 기반 예측시장 프로토콜 카시(Kash)와 수이(Sui) 기반 탈루스(Talus) 인프라를 결합해 경기 결과를 거래 가능한 새로운 시장으로 만들고 있다고 평가했다.
도플 게임즈는 플레이어 대 플레이어(PvP)나 플레이어 대 환경(PvE)과 구별되는 AvA 게임 플랫폼이다. 핵심은 ‘도플 에이전트’다. 이 에이전트들은 모두 동일한 기본 LLM인 Qwen 3.6-27B를 공유하지만, 킴 카다시안, 테오 본, 마이클 세일러 등 특정 공개 인물의 소셜 데이터로 각각 별도로 학습된다. 이 같은 설계는 AvA 게임에서 자주 지적돼 온 두 가지 문제, 즉 같은 모델을 쓰면 비슷한 판단으로 결과가 우연에 좌우되고, 다른 모델을 쓰면 모델 성능 격차가 승패를 결정하는 문제를 동시에 완화하려는 시도다.
이용자는 단순한 관전에 머물지 않는다. 도플 게임즈의 경기는 Base 기반 예측시장 프로토콜 카시와 연결돼 있어, 이용자들은 경기 결과를 거래할 수 있다. 특히 X에서 경기와 결과, 금액을 자연어로 입력하고 카시 봇을 태그하는 방식으로 포지션을 열거나 수정할 수 있다는 점이 특징이다. 카시는 매수·매도에 2% 수수료를 부과하지만 가스비를 지원하고 입출금 수수료는 받지 않는다. 입금 자산은 USDC(USDC), 이더리움(ETH), 랩드 이더리움(wETH), 다이(DAI), 신용카드 등을 지원하며, USDC가 아닌 자산은 자동으로 USDC로 전환된다.
이 구조의 기반에는 탈루스가 있다. 메사리 리서치(Messari Research)는 탈루스를 자율형 AI 에이전트 워크플로를 온체인에서 실행하고, 오프체인 추론 결과를 감사 가능한 온체인 기록으로 남기는 수이 기반 인프라로 설명했다. 도플 게임즈는 이를 통해 카드 분배, 게임 상태 갱신, 에이전트 행동 결과를 수이 블록체인에 기록한다. 특히 경기가 시작되면 어떤 당사자도 실행 도중 로직을 바꿀 수 없도록 설계돼 투명성과 감사 가능성을 높였다.
다만 현재 구조가 완전한 암호학적 검증 단계에 도달한 것은 아니다. 게임 로직과 카드 분배는 온체인에서 실행되지만, 오프체인 LLM 추론 단계는 증명보다는 기록 중심이다. 도플 게임즈는 2026년 3분기 말까지 추론 도구 코드를 오픈소스로 공개하고, 에이전트 의사결정 무결성에 대한 온체인 암호학적 증명을 추가할 계획이다. 이는 ‘검증 가능한 AI’라는 서사가 실제 제품 수준에서 어디까지 구현될 수 있는지를 가늠할 분기점이 될 전망이다.
도플 게임즈의 첫 번째 라이브 제품은 4월 20일 출시된 텍사스 골드엠이다. 이 게임은 도플 에이전트들이 주간 더블 엘리미네이션 방식의 텍사스 홀덤 토너먼트에서 맞붙는 구조다. 경기는 X와 유튜브를 통해 라이브스트리밍되며, 이용자들은 경기 시작 최소 23시간 전부터 카시에서 이진형 예측시장 거래를 시작할 수 있다. 정산은 경기 종료 2시간 후 이뤄진다.
초기 지표도 시장의 관심을 보여준다. 시리즈 4 토너먼트에서는 6개 경기에 251명의 고유 트레이더가 참여했고, 총 470만달러 규모의 테스트넷 거래량이 발생했다. 이어 5월 26일 개설된 테오 본 대 미스터비스트 경기 시장은 48시간 동안 450건의 거래와 130만달러의 거래량을 기록했다. 아직 실제 자금이 본격 유입된 메인넷 데이터로 보기엔 이르지만, MVP 단계의 AvA 예측시장이라는 점을 감안하면 의미 있는 수치로 해석된다.
흥미로운 대목은 에이전트 성향의 반복성과 상성 데이터가 누적되기 시작했다는 점이다. 시리즈 4에서는 마이클 세일러 기반 에이전트가 킴 카다시안 기반 에이전트를 꺾고 결승권 경쟁을 이어갔고, 시리즈 5에서는 테오 본 기반 에이전트가 미스터비스트와 카디 비 기반 에이전트를 제압한 뒤 짐 크레이머 기반 에이전트를 꺾고 우승했다. 여러 시리즈에서 특정 에이전트가 반복적으로 결승에 진출하면서 관전자와 트레이더는 단순 인기투표가 아니라 플레이 스타일과 상성, 압박 상황에서의 반응을 분석할 수 있는 데이터를 확보하게 됐다.
도플 게임즈는 여기에 감정 엔진까지 더할 계획이다. 향후 각 에이전트는 경기 이벤트에 반응해 12개 범주로 구성된 감정 상태를 생성하고, 이 상태가 다음 행동에 영향을 주게 된다. 예컨대 압박 상황에서 더 공격적으로 변하는지, 보수적으로 물러나는지, 블러핑 빈도가 높아지는지 같은 특성을 예측시장 참여자가 읽어내는 ‘메타게임’이 형성될 수 있다. 이는 단순 승패 예측이 아니라 행동 패턴 분석을 거래 자산으로 전환하는 모델이라는 점에서 기존 예측시장과 차별화된다.
탈루스의 자금 조달 이력도 주목할 만하다. 탈루스는 세 차례 라운드를 통해 총 1000만달러를 조달했다. 2024년 2월 300만달러 시드 라운드, 2024년 11월 폴리체인 캐피털 주도의 600만달러 전략적 라운드, 2025년 9월 수이 재단과 월러스 프로토콜 등이 참여한 100만달러 전략적 투자로 이어졌다. 이는 AI 에이전트 인프라와 온체인 실행 계층에 대한 시장 기대가 단순 개념 검증을 넘어 실사용 단계로 이동하고 있음을 보여준다.
‘코멘트’ 도플 게임즈의 실험은 AI 에이전트를 단순 챗봇이나 개인 비서가 아니라 경쟁 주체이자 거래 가능한 확률 자산으로 재정의한다는 점에서 의미가 있다. 특히 AvA 경기 결과 거래는 아직 다른 주요 예측시장 플랫폼이 본격적으로 제공하지 않는 영역이다. 메사리 리서치(Messari Research)의 오스틴 와일러(Austin Weiler)는 도플 게임즈가 텍사스 골드엠을 넘어 추가적인 AvA 게임으로 확장하고 제품-시장 적합성을 입증할 경우, 직접 경쟁자가 드문 시장을 선점할 가능성이 있다고 봤다. 다만 테스트넷 흥행이 메인넷 실거래 수요로 자연스럽게 이어질지, 또 공개 인물 모사형 AI 에이전트가 규제와 초상권 논란을 비껴갈 수 있을지는 여전히 남은 과제다.


