OpenAI가 암호화폐 스마트계약 보안 취약점을 찾아내고, 패치하고, 심지어 악용하는 능력을 측정하기 위한 새로운 AI 에이전트 벤치마크를 공개했다. 스마트계약에 잠겨 있는 막대한 자금 규모를 감안하면, AI가 공격자와 방어자 양쪽 모두에서 어떤 역할을 하게 될지 가늠해 볼 수 있는 시도라는 점에서 주목된다.
OpenAI는 18일(현지시간) 암호화폐 투자사 패러다임과 보안업체 오터섹과 함께 ‘EVMbench: 스마트 계약 보안에서의 AI 에이전트 평가’ 연구 보고서를 발표했다. 이 벤치마크는 총 40건의 스마트계약 감사에서 추린 120개 취약점을 대상으로, 각 AI 모델이 이론적으로 얼마나 많은 자산을 탈취(또는 방어)할 수 있는지 ‘경제적 성과’ 관점에서 점수화한 것이 특징이다.
평가 결과, 앤스로픽의 ‘클로드 오퍼스 4.6’이 평균 ‘탐지 상금(detect award)’ 3만 7,824달러(약 5억 4,700만 원)로 1위를 차지했다. 이어 오픈AI의 ‘OC-GPT-5.2’가 3만 1,623달러(약 4억 5,700만 원), 구글 ‘제미니 3 프로’가 2만 5,112달러(약 3억 6,300만 원)를 기록하며 뒤를 이었다. 탐지 상금은 해당 취약점을 발견하고 악용을 막았다고 가정했을 때, 이론적으로 ‘구할 수 있었던 자산 가치’를 달러로 환산한 지표다.
‘경제적 환경’에서의 AI 성능, 스마트계약으로 시험대 오른다
EVMbench의 핵심은 AI를 단순 코드 도우미가 아니라, 실제 경제 활동에 영향을 미치는 ‘에이전트’로 본다는 점이다. 오픈AI는 보고서에서 “AI 에이전트가 점점 더 복잡한 작업을 수행하게 되면서, 이들을 ‘경제적으로 의미 있는 환경’에서 평가하는 것이 중요해지고 있다”고 강조했다.
스마트계약은 탈중앙화금융(디파이)와 온체인 게임, 파생상품 등 다양한 분야에서 ‘수십억 달러’ 규모 자산을 관리하는 인프라다. 오픈AI는 “스마트계약은 수십억 달러 규모 자산을 보호하고 있으며, AI 에이전트는 공격자와 방어자 모두에게 변곡점이 될 수 있다”고 지적했다.
특히 회사는 향후 ‘에이전트 기반 스테이블코인 결제(agentic stablecoin payments)’가 크게 성장할 것으로 내다봤다. AI 에이전트들이 스스로 스테이블코인 결제를 실행하며 경제 활동의 주체로 참여하게 되고, 스마트계약 보안은 그 토대가 된다는 설명이다.
스테이블코인 발행사 서클의 제레미 얼레어 CEO도 올해 1월 “향후 5년 안에 수십억 개의 AI 에이전트가 사용자를 대신해 일상 결제를 처리하게 될 것”이라며, 이들이 활용하는 주요 수단으로 스테이블코인을 지목한 바 있다. 바이낸스 창업자 창펑 자오 역시 최근 “암호화폐가 AI 에이전트의 ‘네이티브 통화’가 될 것”이라고 내다봤다.
2025년 34억 달러 탈취… AI 에이전트, 공격과 방어 모두에 쓰인다
오픈AI가 ‘에이전트형 AI’의 스마트계약 보안 역량을 수치화하려는 배경에는 해킹 피해가 좀처럼 줄지 않는 현실이 있다. 각종 온체인 데이터와 보안 보고서에 따르면 2025년 한 해 동안 공격자들이 탈취한 암호화폐 자산은 약 34억 달러(약 4조 9,200억 원)에 달했다. 전년 대비 소폭 증가에 그쳤지만, 규모 자체가 여전히 막대하다.
EVMbench는 이런 환경에서 AI가 ‘얼마나 빨리, 어느 수준까지’ 취약점을 포착하고, 패치 제안이나 악용 시나리오를 만들어낼 수 있는지 측정한다. 120개 취약점은 대부분 오픈소스 감사 대회와 버그 바운티 사례에서 추린 것으로, 이미 실전에서 문제를 일으켰거나 그에 준하는 난이도라는 점에서 의미가 있다.
오픈AI는 연구를 통해 “EVMbench가 스마트계약 취약점 탐지·완화 분야에서 AI의 발전 속도를 장기적으로 추적하는 기준점이 되길 바란다”며, 궁극적으로는 대규모 온체인 시스템 전체의 보안성을 끌어올리는 데 기여할 수 있다고 기대했다.
“스마트계약은 인간을 위해 설계되지 않았다”
이번 연구는 AI 에이전트와 암호화폐가 만나는 지점에 대한 논쟁도 다시 불러일으켰다. 벤처캐피털 드래곤플라이의 매니징 파트너 하심 쿠레시(Haseeb Qureshi)는 같은 날 X(옛 트위터)에 글을 올려, 스마트계약과 기존 금융의 사용 경험 차이를 언급했다.
그는 “암호화폐가 재산권과 법적 계약을 대체하겠다는 약속은 아직 실현되지 못했다. 기술이 실패해서가 아니라, 인간의 직관에 맞게 설계되지 않았기 때문”이라고 진단했다. 수백만 달러 상당의 온체인 거래를 승인해야 할 때마다 여전히 ‘지갑 털이(drainer) 공격’과 각종 위협이 머릿속을 스친다며, 같은 금액을 은행 송금할 때와 비교해 체감 불안감이 훨씬 크다고 털어놨다.
대신 그는 앞으로의 암호화폐 사용 경험은 인간이 직접 서명하는 방식이 아니라, ‘AI가 중개하는 자율 지갑(self-driving wallet)’ 형태로 진화할 것이라고 내다봤다. 이 지갑들은 사용자를 대신해 피싱, 악성 스마트계약, 과도한 가스비, 복잡한 디파이 전략 등을 자동으로 식별·처리하고, 필요하면 여러 트랜잭션을 묶어 실행하는 ‘매니저’ 역할을 수행하게 된다.
AI 에이전트가 열어줄 ‘자율 지갑’ 시대
쿠레시는 예로 온체인 에이전트 실험 플랫폼 ‘몰트북(Moltbook)’을 들었다. 그는 “지금은 아주 원시적인 단계지만, 에이전트들이 서로에게 무언가를 지불하기 위한 방식을 찾으려 하는 모습을 이미 볼 수 있다”고 설명했다. 즉, 인간이 아닌 AI 에이전트들끼리 작업을 의뢰하고, 그 대가를 암호화폐로 정산하는 구조가 싹트고 있다는 의미다.
그는 “많은 기술은 ‘보완재’가 나타난 후 비로소 제자리를 찾는다”며 “GPS는 스마트폰을, TCP/IP는 웹 브라우저를 기다려야 했다. 암호화폐에 대해서는, 그 보완재를 AI 에이전트에서 찾게 될 수도 있다”고 말했다. 스마트계약이 인간에게는 여전히 낯설고 위협적인 인터페이스지만, AI 에이전트에게는 기계적으로 해석하고 실행하기 쉬운 ‘자연 환경’이 될 수 있다는 시각이다.
스마트계약 보안, AI와 함께 ‘규모의 게임’으로
EVMbench는 AI와 스마트계약 보안을 둘러싼 양면성을 동시에 보여준다. 한편으로는 뛰어난 AI 에이전트가 그 어느 때보다 정교한 공격 도구로 악용될 수 있고, 다른 한편으로는 같은 기술이 대규모 온체인 시스템을 지키는 ‘자동 방화벽’ 역할을 할 수도 있다.
이번 연구는 당장 투자 판단에 직접적인 영향을 주기보다는, 향후 암호화폐 인프라와 AI 기술이 맞물리며 어떻게 ‘규모의 게임’을 벌이게 될지 가늠하게 해 준다. 스마트계약이 관리하는 자산 규모가 커질수록, 이를 노리는 공격과 막아내려는 방어 모두 AI 의존도가 높아질 가능성이 크다.
결국 시장이 주목해야 할 지점은 단순히 “어느 모델이 더 잘 찾나”가 아니라, 이런 벤치마크가 스마트계약 설계·감사·운용 전 과정에 어떻게 녹아들어 실제 위험을 줄여 나가느냐다. AI 에이전트와 암호화폐가 서로의 ‘보완재’가 된다면, 스마트계약 생태계의 보안 패러다임 자체가 다시 짜일 수 있다.
💡 "AI 에이전트 시대, 스마트계약을 이해하는 투자자만이 살아남는다"
AI가 스마트계약의 취약점을 찾고, 패치하고, 심지어 악용하는 시대입니다. 이제 온체인 인프라는 인간이 직접 모든 리스크를 감당하는 영역이 아니라, 수십억 개의 AI 에이전트가 서로 자산을 주고받는 거대한 자동화 경제로 빠르게 진화하고 있습니다.
문제는, 이 복잡한 구조를 이해하지 못한 채 단순히 "수익률"만 보고 들어가면, 2025년 34억 달러가 털려 나간 것처럼 다음 피해자가 될 수 있다는 점입니다. 어떤 스마트계약에 자산을 맡기고, 어떤 디파이 전략과 에이전트 지갑을 신뢰할 것인가 — 그 판단 기준을 세우는 것이 앞으로의 투자자에게 가장 중요한 생존 스킬이 됩니다.
대한민국 1등 블록체인 미디어 토큰포스트가 준비한 토큰포스트 아카데미는 이런 환경에서 **"AI와 스마트계약, 디파이, 파생상품까지 구조를 이해하고 리스크를 관리하는 투자자"**를 만들기 위한 7단계 마스터클래스입니다.
Phase 1: The Foundation (기초와 진입)에서는 비트코인·스마트컨트랙트 체인·스테이블코인 등 자산의 본질부터, 지갑 보안·거래소 온보딩·세금까지 기본기를 다집니다. AI 에이전트가 대리로 결제하고 거래하는 미래일수록, 사용자가 지켜야 할 보안 원칙과 자산 보관 구조를 이해하는 것은 필수입니다.
Phase 2: The Analyst (분석가) 과정은 기사에서 언급된 ‘수십억 달러가 잠긴 스마트계약’의 이면을 들여다보는 파트입니다.
토크노믹스와 온체인 데이터를 통해
- 인플레이션과 락업 해제 구조
- 내부자·VC 물량
- 실제 활성 사용자와 매출(Revenue)
를 분석해, AI 에이전트가 어떤 프로토콜 위에서 돌아가고 있는지, 그 기반이 얼마나 지속 가능하고 안전한지 스스로 판별하는 눈을 길러줍니다.
Phase 3: The Strategist (투자 전략과 포트폴리오)에서는 거시 사이클과 위험자산 변동성 속에서 어떻게 현금·크립토·레버리지를 배분할지, DCA와 포트폴리오 구축 원칙을 배우며 “AI·온체인 인프라 테마가 부각될 때, 포트폴리오를 어떻게 준비할 것인가”에 대한 전략을 세웁니다.
Phase 4: The Trader (테크니컬 분석과 트레이딩) 과정은 온체인 섹터와 AI 관련 코인들의 급등·급락 국면에서 휘둘리지 않도록,
- 추세와 지지·저항
- 로그 차트, 이동평균, 반전 패턴
을 활용해 스스로 매수·매도 구간을 설계하는 법을 다룹니다. “AI 에이전트”라는 화려한 서사에 휩쓸리지 않고, 차트와 수급으로 냉정하게 대응하는 힘을 길러줍니다.
Phase 5: The DeFi User (탈중앙화 금융)에서는 실제로 AI 에이전트와 자율 지갑이 올려탈 인프라, 즉 디파이의 구조를 깊게 파고듭니다.
- DEX(AMM vs 오더북)의 구조
- 유동성 공급(LP)과 비영구적 손실
- 렌딩·차입의 LTV, 청산 메커니즘
을 이해하면, ‘에이전트가 실행하는 디파이 전략’을 단순히 믿고 맡기는 대신, 그 전략의 리스크와 기대 수익을 스스로 검증할 수 있게 됩니다.
Phase 6: The Professional (선물·옵션 심화)는 기사에서 언급된 것처럼 “공격과 방어가 동시에 고도화되는 환경”에서 포트폴리오를 방어·헤지하는 기술을 다루는 단계입니다.
- 레버리지와 마진 구조, 펀딩비
- 손절·포지션 사이징·청산가 관리
- 옵션을 활용한 하락 방어(Protective Put)와 수익 전략
을 통해, 온체인 해킹 이슈나 규제·매크로 쇼크가 올 때도 단순 공포가 아니라 구조적 대응을 할 수 있게 해 줍니다.
Phase 7: The Macro Master (거시 사이클과 시장 구조)에서는 비트코인 반감기, 글로벌 유동성, 과거 온체인 데이터와 포트폴리오 업데이트 사례들을 통해 “AI 에이전트, 스마트계약, 디파이, 파생상품이 어떤 순서로 시장 사이클에 녹아드는지”를 거시적 눈으로 복기합니다. 결국 장기적으로 승리하는 투자자는, 기술 트렌드의 소음이 아니라 유동성과 사이클의 본질을 보는 사람입니다.
AI 에이전트가 스마트계약을 읽고, 결제하고, 디파이 전략을 집행하는 시대가 다가올수록, 인간 투자자의 승부처는 단 하나입니다.
“내 자산이 올라타 있는 구조를, 내가 이해하고 있는가?”
토큰포스트 아카데미는 기초부터 온체인 분석, 디파이, 선물·옵션, 매크로 사이클까지 이어지는 7단계 커리큘럼으로 이 질문에 스스로 답할 수 있는 투자자를 만드는 것을 목표로 합니다.
지금, AI와 스마트계약이 만들어 낼 다음 시장 사이클에 대비할 수 있는 체계를 세워보세요.
커리큘럼: 기초부터 디파이, 선물옵션, 매크로까지 7단계 마스터클래스
첫 달 무료 이벤트 진행 중!
바로가기: https://www.tokenpost.kr/membership
🔎 시장 해석
OpenAI, Paradigm, OtterSec이 함께 공개한 EVMbench는 AI 에이전트가 이더리움 기반 스마트 컨트랙트의 취약점을 "발견·패치·악용"하는 실제 능력을 돈 단위(가상 상금)로 측정한 벤치마크입니다.
상위 모델들은 수만 달러 규모의 취약점 탐지 상금을 기록하며, 현재 AI가 상당 수준의 보안 분석 및 공격 시뮬레이션을 수행할 수 있음을 보여줍니다.
연간 수십억 달러가 해킹으로 유출되는 상황에서, AI가 보안 연구와 실전 방어·공격 모두에 영향을 미치는 전략 자산으로 부상하고 있습니다.
AI 에이전트와 스테이블코인 결제가 결합되면, 온체인 자산이 단순 투자 대상이 아닌 AI 경제 인프라로 재평가될 수 있으며, 이는 장기적으로 스마트 컨트랙트와 인프라 레벨 보안 수요를 키우는 요인이 됩니다.
💡 전략 포인트
보안·인프라 투자: EVMbench 같은 지표는 향후 "AI 대응형 보안 솔루션"과 온체인 모니터링 인프라 기업의 성장 가능성을 뒷받침하는 근거로 활용될 수 있습니다.
AI + 크립토 교차 영역: 안정적인 스테이블코인 결제, 지갑 인프라, 키·권한 관리 솔루션 등은 AI 에이전트가 실제로 사용하는 레이어가 될 가능성이 높아, 중장기 프레임에서 주목할 만합니다.
개발·감사 측면: 스마트 컨트랙트 개발자와 감사 업체는 AI를 활용한 자동화된 취약점 탐지·패치 파이프라인을 구축해, 감사 효율과 범위를 확대하는 것이 경쟁력 요소가 될 수 있습니다.
규제·리스크 관리: AI가 공격에도 활용될 수 있는 만큼, 거래소·수탁사·디파이 프로토콜은 AI 기반 위협 탐지 → 온체인 차단 → 자산 동결까지의 프로세스를 미리 설계해야 합니다.
📘 용어정리
EVMbench: 이더리움 가상머신(EVM) 기반 스마트 컨트랙트의 보안 취약점을 AI 에이전트가 얼마나 잘 찾고, 고치고, 악용할 수 있는지 평가하는 OpenAI·Paradigm·OtterSec 공동 벤치마크입니다.
AI 에이전트(Agentic AI): 사람이 일일이 지시하지 않아도, 목표를 설정하고 스스로 계획·실행·피드백을 반복하는 형태의 자율형 인공지능입니다. 예를 들어, 스스로 디파이 프로토콜을 탐색해 수익 기회를 찾는 봇 등이 이에 해당합니다.
스마트 컨트랙트: 블록체인 위에서 자동 실행되는 프로그램으로, 조건이 충족되면 중개자 없이 자산 이동·거래·정산 등을 처리합니다. 주로 이더리움과 EVM 호환 체인에서 사용됩니다.
드레이너 지갑(Drainer Wallet): 피싱·악성 DApp 등을 통해 사용자의 서명을 유도해 자산을 한 번에 탈취하는 공격용 지갑 또는 스크립트를 일컫습니다.
자가 운전(셀프 드라이빙) 지갑: AI 에이전트가 내장돼 사용자를 대신해 수수료 최적화, 리스크 관리, 거래 실행 등을 자동으로 처리하는 차세대 지갑 개념입니다.
자주 묻는 질문 (FAQ)
Q.
EVMbench가 뭔가요?
EVMbench는 OpenAI가 Paradigm, OtterSec과 함께 만든 평가 도구입니다. 인공지능 에이전트가 이더리움 계열 스마트 계약(블록체인 위에서 자동 실행되는 프로그램)의 보안 취약점을 얼마나 잘 찾고, 수정하고, 실제로 악용까지 할 수 있는지를 실험합니다. 40건의 보안 감사에서 뽑은 120개의 실제 취약점을 사용해, 각 AI가 이론적으로 얼마나 많은 금액을 빼낼 수 있었는지를 상금 형태로 계산해 비교합니다.
Q.
왜 이런 테스트가 암호화폐 투자자에게 중요한가요?
스마트 계약에는 이미 수십억 달러 규모의 자산이 잠겨 있고, 2025년에만 약 34억 달러 상당의 암호화폐가 해킹으로 유출됐습니다. 이제 공격자와 방어자 모두 AI를 활용하기 시작하면서, AI가 실제로 어느 정도 수준의 해킹·방어를 할 수 있는지 아는 것이 리스크 관리에 매우 중요해졌습니다. 이런 벤치마크를 통해 어떤 종류의 취약점이 AI에 특히 취약한지, 또 어떤 보안 도구가 필요한지 더 구체적으로 파악할 수 있습니다.
Q.
AI 에이전트가 스테이블코인으로 결제한다는 말은 실제로 어떻게 쓰이나요?
AI 에이전트는 사람 대신 반복 업무를 수행하는 자율형 프로그램입니다. 예를 들어, 사용자를 대신해 여러 디파이 서비스의 수익률을 비교하고, 가장 유리한 곳에 자동으로 예치·인출하거나, 온라인 서비스 비용을 대신 지불하는 식입니다. 이때 국경과 은행 시간의 제약이 없는 스테이블코인(달러 가치에 고정된 코인)을 사용하면, AI가 24시간 전 세계 서비스를 마음대로 이용할 수 있습니다. 기사에서 언급된 것처럼, 이런 흐름이 커지면 장기적으로는 "AI 에이전트가 사용하는 기본 통화"가 전통 화폐가 아니라 암호화폐가 될 수 있다는 전망이 나오는 이유입니다.
TP AI 유의사항
TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.





