DeepSeek, 에이전트 처리량 최대 2배 높이는 ‘DualPath’ 추론 시스템 제안

2026년 2월 27일 16:38:11 | 토큰포스트 속보

PANews에 따르면 DeepSeek 팀이 차세대 플래그십 모델 DeepSeek V4 공개를 앞두고 에이전트 워크로드에 특화된 새로운 추론 시스템 ‘DualPath’를 제안하는 학술 논문을 발표했다.

논문에서 DeepSeek는 대규모 언어모델(LLM)을 활용한 에이전트 시스템 환경에 맞춰 추론 성능을 최적화한 시스템 구조를 소개했다. 핵심은 ‘DualPath 읽기 KV 캐시’ 메커니즘으로, 메모리 캐시와 유사한 KV 캐시를 이중 경로로 읽어 스토리지와 네트워크 부하를 재분배하는 방식이다.

DeepSeek 측은 이 구조를 적용할 경우 오프라인 추론 처리량이 최대 1.87배, 온라인 서비스 환경에서 초당 평균 에이전트 실행 횟수가 1.96배까지 증가하는 것으로 나타났다고 밝혔다.

논문은 또한 대규모 모델이 단일 턴 챗봇이나 독립형 추론 모델에서 벗어나, 자율적인 계획 수립·도구 호출·다중 턴 상호작용을 통해 실제 작업을 수행하는 ‘에이전트 시스템’으로 빠르게 진화하고 있다고 짚었다. 이에 따라 기존의 ‘사람-모델’ 단일 상호작용에서 ‘사람-모델-환경’이 반복적으로 상호작용하는 구조로 워크로드가 바뀌고 있으며, 상호작용 횟수는 수십~수백 회에 이를 수 있다고 설명했다.

이번 DualPath 제안은 이러한 에이전트 중심 LLM 사용 패턴에 맞춰 추론 인프라 효율을 극대화하기 위한 시도로 평가된다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

많이 본 기사

4월 15일 출근길 팟캐스트 — 선물시장 5억3200만달러 청산, 숏 대거 정리 속 비트코인 강세

비트텐서, 거버넌스 논란에 24% 급락…AI 토큰 1위 흔들리나

팍소스랩스, 암플리파이 확장에 1200만달러 유치…크립토 예치·대출 경쟁 본격화

스테이블코인 제도화 수혜주로 ICTK 지목…양자암호 보안 수요 커진다

"차기 연준 의장 후보, 폴리마켓·솔라나·dYdX 주주였다"…크립토 시장, 워시 지명에 불붙나

지금 꼭 알아야 할 리포트

트럼프 일가 WLFI, 자체 토큰 담보 대출 논란…디파이 집중 리스크 커졌다

[마켓분석] "시장은 전쟁 종전을 잘못 읽고 있다"…원유 약세 베팅 나선 월가

스트레티지, STRC 확대에 비트코인 매수 탄력…MSTR 희석 압박 커지나