앤트로픽 PBC가 자사 AI 에이전트에 이른바 ‘드리밍’ 기능을 도입했다. 단순히 대화를 이어가는 수준을 넘어, 과거 작업과 상호작용을 되짚어 반복되는 실수와 유용한 패턴을 찾아내고 이후 업무에 반영하도록 한 것이 핵심이다.
이번 업데이트는 개발자 행사 ‘코드 위드 클로드’에서 공개됐다. 대상은 ‘클로드 매니지드 에이전트’로, 개발자가 메시지 API 위에 에이전트를 직접 구축하지 않아도 되도록 만든 사전 구성형 도구다. 앤트로픽은 이를 여러 에이전트가 수분에서 수시간 동안 같은 프로젝트를 나눠 수행하는 환경에 적합한 구조라고 설명했다.
드리밍은 예약된 검토 과정이다. 에이전트가 이전 세션과 메모리 저장소를 살펴본 뒤, 반복되는 패턴을 추출하고 향후 작업에 도움이 될 만한 기억만 골라 정리한다. 사용자는 에이전트가 얼마나 자주 드리밍을 수행할지 정할 수 있고, 메모리 업데이트를 자동으로 허용할지 아니면 변경 내용을 먼저 검토할지도 선택할 수 있다.
이 기능이 주목받는 이유는 대규모언어모델이 가진 ‘문맥 창’ 한계와 맞닿아 있다. 긴 작업을 수행할수록 중요한 정보가 뒤로 밀려 사라질 수 있는데, 기존 챗봇은 보통 긴 대화를 압축해 핵심만 남기는 방식으로 이를 보완해왔다. 다만 이런 방식은 하나의 대화, 하나의 에이전트에 주로 국한된다는 한계가 있다.
반면 드리밍은 여러 AI 에이전트의 과거 세션과 메모리를 함께 분석할 수 있다는 점이 다르다. 앤트로픽은 블로그 글에서 “단일 에이전트가 혼자서는 볼 수 없는 패턴을 드러낸다”며 반복 실수, 에이전트들이 수렴하는 작업 방식, 팀 전체에 공유된 선호를 파악하는 데 도움이 된다고 설명했다. 장기 프로젝트나 다중 에이전트 오케스트레이션에 특히 유용하다는 게 회사 측 판단이다.
앤트로픽은 드리밍 기능을 현재 ‘리서치 프리뷰’로 제공한다. 개발자가 별도로 접근 권한을 요청해야 하며 승인까지 시간이 걸릴 수 있다. 대신 이날부터 기존 프리뷰 기능 두 가지는 더 넓은 범위로 공개했다.
첫 번째는 ‘아웃컴’ 기능이다. 이는 AI 에이전트가 무엇을 ‘좋은 결과’로 봐야 하는지 더 분명히 이해하도록 돕는 장치다. 사용자가 각 작업에 대해 이상적인 결과물의 예시를 만들어주면, 별도의 ‘채점 에이전트’가 실제 산출물을 그 예시와 비교해 기대 수준에 맞는지 평가한다.
앤트로픽에 따르면 이 기능은 세부 사항 점검과 빠짐없는 커버리지가 필요한 업무에서 특히 효과적이다. 동시에 브랜드 문체를 맞춘 블로그 글이나 소셜미디어 문안처럼 품질 판단이 다소 주관적인 작업에도 도움이 될 수 있다. 회사 측 내부 테스트와 초기 사용자 사례에서는 예시 없이 일반 프롬프트만 썼을 때보다 작업 성공도가 최대 10포인트 개선됐다고 밝혔다.
함께 공개 범위가 넓어진 또 다른 기능은 ‘멀티 에이전트 오케스트레이션’이다. 복잡한 작업을 더 작은 단위로 나눈 뒤, 리드 에이전트가 이를 여러 하위 에이전트에 배분하는 방식이다. 사용자는 클로드 콘솔에서 각 하위 에이전트가 어떤 과정을 거쳐 작업을 수행했는지 확인할 수 있어, 결과뿐 아니라 처리 과정까지 검토할 수 있다.
이 두 기능은 이제 매니지드 에이전트 퍼블릭 베타에서 사용할 수 있다. 앤트로픽은 이와 함께 프로와 맥스 구독자의 기존 5시간 사용 한도도 두 배로 늘려 10시간으로 확대한다고 덧붙였다.
이번 업데이트는 AI 에이전트 경쟁이 ‘더 똑똑한 답변’에서 ‘더 나은 업무 수행’으로 이동하고 있음을 보여준다. 단순 생성 능력보다 기억 관리, 작업 평가, 에이전트 간 협업 구조가 핵심 차별화 요소로 부상하는 흐름이다. 장기적으로는 기업용 자동화 시장에서 이런 ‘기억하는 에이전트’가 실질적인 생산성 도구로 자리 잡을 가능성이 커 보인다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
많이 본 기사