토픽

맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

AI도 '연습생 시대'…中 연구진, 절차기억 기반 LLM 강화 기법 공개

프로필
김민준 기자
댓글 0
좋아요 비화설화 0

중국 저장대와 알리바바가 절차기억 기반의 '멤프(Memp)'로 LLM의 문제 해결 능력을 비약적으로 향상시켰다고 밝혔다. AI가 과거 시행착오를 바탕으로 학습하며, 비용 절감과 성능 향상을 동시에 실현할 수 있다는 분석이다.

 AI도 '연습생 시대'…中 연구진, 절차기억 기반 LLM 강화 기법 공개 / TokenPost.ai

AI도 '연습생 시대'…中 연구진, 절차기억 기반 LLM 강화 기법 공개 / TokenPost.ai

대규모 언어 모델(LLM)의 능력을 강화하는 새로운 기법이 중국 저장대와 알리바바그룹의 연구진을 통해 공개됐다. 이들은 ‘멤프(Memp)’라는 절차기억 기반의 구조를 통해 AI 에이전트들이 과거 경험을 토대로 문제 해결 효율성을 획기적으로 높일 수 있는 프레임워크를 제안했다. 이 기술은 매번 새롭게 시작할 필요 없이, 시행착오를 축적해 다음 과업에서 더 나은 성과를 내도록 돕는다.

현재 LLM 기반 AI는 복잡한 다단계 업무 자동화에 널리 사용되고 있으나, 실제 업무 적용 땐 네트워크 오류나 UI 변화 등 예상치 못한 변수가 빈번히 발생하면서 전체 과정이 중단되는 일이 잦다. 더욱이 기존 시스템은 문제 해결 흐름을 매번 처음부터 다시 배워야 하며, 이는 시간과 비용 측면에서 비효율을 초래한다.

연구진은 이러한 한계를 극복하기 위해 인간의 기술 습득과 유사한 ‘절차기억’을 기계에 구현하는 방식에 주목했다. 절차기억은 자전거 타기나 타자처럼 반복 학습을 통해 자동화되는 기억 형태로, 형식 지식과 달리 실제 행동을 통해 익히는 ‘방법’에 가깝다. 멤프는 AI가 이 같은 절차지식을 지속적으로 학습·갱신하며 실제 환경에서도 적응력을 유지하도록 설계됐다.

멤프의 핵심은 ‘기억 생성-검색-업데이트’라는 세 단계로 구성된 순환 구조다. 에이전트는 과거 작업에서 얻은 경험을 그대로 기록하거나 요약된 단계로 저장할 수 있으며, 새로운 과제를 수행할 때 이 경험들을 참조해 유사 상황에 더 빠르게 대응한다. 특히 실패 경험까지 반영해 기존 기억을 수정하거나 제거함으로써, 기억의 질을 지속적으로 정제한다는 점에서 차별성이 크다.

기존 AI 시스템의 메모리 구조는 대개 개발자가 수동으로 정리한 템플릿이나 모델 내부 파라미터에 묶여 있어 새로운 정보 반영이나 수정이 제한적이다. 반면 멤프는 이러한 정적 구조를 벗어나 사용 중인 에이전트가 실제 수행 과정에서 스스로 기억을 재구성할 수 있도록 한다. 메모리 검색엔 키워드 추출이나 벡터 유사도 기반 탐색이 활용되며, 실패 교훈을 반영해 기억 품질을 상승시키는 전략까지 더해진다.

연구에 따르면 멤프를 적용한 에이전트는 기존 대비 작업 성공률이 높고 작업 시 소모되는 단계 수와 토큰 수가 크게 줄어드는 성과를 냈다. 특히 GPT-4o 같이 성능이 우수한 모델로 구축한 절차기억을 중간 수준의 모델인 Qwen2.5-14B에 이식했음에도 성능 향상이 뚜렷하게 확인됐다. 이는 고성능 모델이 학습한 내용을 저비용 모델에서도 효과적으로 활용할 수 있다는 뜻으로, 기업 입장에선 AI 인프라 구축 비용을 줄일 수 있는 가능성을 보여준다.

또 하나의 큰 장점은 초기 학습 시 ‘완벽한 답안’을 일일이 제공할 필요가 없다는 점이다. 연구팀은 별도의 정답 경로 없이 평가 기준만 명확히 설정해놓으면, 우수한 LLM이 다양한 가능성을 탐색하고 평가 기준을 충족하는 경로만 선택해 초기 기억을 생성할 수 있도록 시스템을 구성했다. 이로써 이른바 ‘콜드 스타트’ 문제도 효과적으로 해결할 수 있게 됐다.

멤프는 이미 GPT-4o, 클로드 3.5 소넷, Qwen2.5 등 최신 모델에 적용되며 ALFWorld나 TravelPlanner 같은 복잡 업무 환경에서도 개선된 성능을 증명했다. 특히 절차기억이 유사 업무 간에도 전이 가능하다는 것은, 기업 내 다양한 반복 업무를 하나의 경험으로 해결할 수 있다는 점에서 활용처가 크다.

다만 연구진은 완전한 자율 에이전트를 구축하려면 아직 갈 길이 멀다고 본다. 연구보고서 작성처럼 명확한 성공 기준이 없는 과업에서는 에이전트가 자체적으로 성과를 평가하고 개선해야 하기 때문이다. 이를 해결하기 위한 방안으로는 제2의 LLM을 판별자로 둬 자체 학습 루프를 완성하는 전략이 제시되고 있다. 단순한 룰 기반 채점에서 벗어나 유연하고 정교한 피드백을 제공하는 방향이다.

오늘날 많은 기업이 AI 기반 업무 자동화에 투자하고 있는 가운데, 멤프는 비용 절감과 성능 향상을 동시에 실현할 수 있는 새로운 전환점으로 주목받고 있다. 이제 AI도 '연습을 통해 숙련된다'는 원리가 기술적으로 구현되고 있는 것이다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

관련된 다른 기사

주요 기사

[비트코인은 지금] 비트코인, 가격 반등 속 도미넌스 하락·대규모 순유입…변동성 경계

[비트코인은 지금] 비트코인, 가격 반등 속 도미넌스 하락·대규모 순유입…변동성 경계

트럼프 밈코인 'TRUMP', 미국 최초 밈코인 ETF로 등장하나…SEC 승인 여부 주목

트럼프 밈코인 'TRUMP', 미국 최초 밈코인 ETF로 등장하나…SEC 승인 여부 주목

[오후 뉴스브리핑] 카인들리MD, 최대 $50억 조달 계획...BTC 매수 外

[오후 뉴스브리핑] 카인들리MD, 최대 $50억 조달 계획...BTC 매수 外

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1