2026년 첫 AI 보안 분야 주요 테스트가 시작됐다. PANews는 1월 5일 보도를 통해, LISABench가 Web3 스마트 계약 취약점 탐지 분야의 최고 AI 모델을 선발하기 위한 1분기 벤치마크 평가를 시작했다고 밝혔다.
이번 테스트에는 GPT-5.2(OpenAI), Claude 4.5 Sonnet(Anthropic), Gemini-3-pro-preview(Google), DeepSeek V3.2, KIMI K2(Moonshot AI), QWen 3 30b-a3b(Alibaba Cloud), GLM 4.6(Zhipu AI) 등 총 7개의 최첨단 모델이 참가했다.
LISABench는 이번 테스트와 함께 커뮤니티가 평가 결과를 예측하는 투표 및 보상 프로그램도 함께 운영 중이다. 벤치마크 코드베이스는 GitHub를 통해 오픈소스로 공개돼, 개발자들이 직접 검토하고 재현할 수 있도록 했다.




