맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

PinchBench 벤치마크, Gemini 3 Flash OpenClaw 작업 성공률 95.1%로 1위

프로필
토큰포스트 속보
댓글 0
좋아요 비화설화 0
 PinchBench 벤치마크, Gemini 3 Flash OpenClaw 작업 성공률 95.1%로 1위

보안업체 慢霧(SlowMist) CISO 23pads가 X를 통해 AI 대형 언어모델 벤치마크 결과를 공유했다. PinchBench 기준 테스트에 따르면 에이전트 과제 세트인 OpenClaw 작업 수행 능력을 평가한 결과, Gemini 3 Flash의 작업 성공률이 95.1%로 가장 높게 나타났다.

이어 minimax-m2.1이 93.6%, kimi-k2.5가 93.4%로 2·3위를 기록했으며, Claude Sonnet 4.5는 92.7%, GPT-4o는 85.2% 성공률을 보였다. 이번 평가는 여러 주요 LLM의 에이전트·자동화 작업 수행 능력을 비교한 결과라는 설명이다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

1

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

등급

석이시대

12:54

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1
오늘 하루 열지 않음[닫기] Close

토큰포스트 프리미엄 멤버십, 이 모든 혜택을 무료로 시작하세요

AI신호 + 60강좌 + BBR매거진 + 에어드랍 WL 기회까지!