“AI, 사람처럼 배우게 하라”… 패트로너스 AI, 자율형 에이전트 훈련 플랫폼 공개

| 김민준 기자

AI 에이전트의 역량을 인간 수준으로 끌어올리기 위한 기술 개발이 본격적으로 추진되고 있다. AI 모델 훈련 및 평가 도구 전문 스타트업 패트로너스 AI(Patronus AI)가 자율형 AI 에이전트의 지속적인 진화를 지원하기 위한 신제품 ‘생성 시뮬레이터(Generative Simulators)’를 공개했다.

이번에 선보인 생성 시뮬레이터는 패트로너스 AI의 핵심 기술인 강화학습(RL) 환경을 보다 동적으로 운용하기 위한 구성 요소로, AI 에이전트가 정적 테스트에만 의존하지 않고 변화무쌍한 실제 업무 시나리오 속에서 지속적으로 역량을 강화할 수 있도록 돕는다. 시나리오는 실시간으로 생성되며 상황 조건, 과업 범위, 평가 기준 등이 모두 변화 가능한 방식으로 설계됐다. 이로써 고정된 테스트 조건 대신 ‘살아 움직이는 훈련 공간’을 제공한다는 점에서 차별화를 입증한다.

패트로너스 AI는 현대의 생성형 AI 모델이 실제 업무 현장에서 부딪히는 문제점으로, 정적 벤치마크만을 기준으로 설계돼 현실에서 요구되는 상호작용의 유연성과 복합적인 의사결정을 반영하지 못한다고 지적한다. 이에 따라 생성 시뮬레이터는 AI 에이전트가 실시간 피드백을 받아가며 다양한 변수에 대응하도록 훈련되어야 진정한 ‘자율성’을 확보할 수 있다고 보고 있다.

패트로너스 AI의 공동 창업자이자 최고경영자인 아난드 칸나판(Anand Kannappan)은 “전통적 벤치마크로는 AI의 고도화된 사고 능력을 제대로 평가할 수 없다”며 “실제 업무 환경은 끊임없는 문맥 전환과 중단, 협업 요구사항으로 가득하다. 인간처럼 학습하려면 그런 요소를 그대로 반영한 다이내믹한 환경이 필수”라고 설명했다.

평가는 자사의 경량형 고성능 평가 모델인 ‘글라이더(Glider)’를 통해 진행되며, 필요한 경우 별도 모델인 ‘퍼시벌(Percival)’이 에이전트의 워크플로를 분석해 오류 유발 요소를 식별하면서 개선 방안을 제시하고 자동 수정까지 실행한다. 이로써 인간 개입 없이도 AI의 진화 속도를 끌어올리는 밑바탕이 마련된다.

특히 이번 제품에는 ‘ORSI(Open Recursive Self-Improvement)'라는 혁신적 학습 기법도 포함됐다. ORSI는 복잡한 과업을 부분적으로 분해하고 피드백을 순환적으로 반영해 학습하는 구조로, 매 시도마다 전체를 재학습할 필요 없이 성능 개선이 가능하도록 설계돼 학습 효율성이 높다고 평가된다.

패트로너스 AI의 최고기술책임자(CTO) 레베카 치안(Rebecca Qian)은 “진정한 AI 가치는 반복되는 테스트에서 좋은 점수를 받는 데 있지 않다”며 “협업, 우선순위 관리, 실시간 판단 등 실제 환경에서 요구되는 문제를 얼마나 유연하게 처리하느냐가 핵심”이라고 강조했다.

패트로너스 AI는 ‘기초모델(Foundation Model)’ 기업들이 점점 더 복잡해지는 업무 환경에 적응 가능한 AI 에이전트를 개발할 수 있도록, 이 RL 플랫폼을 산업 전반으로 확장할 계획이다. AI 시장이 정형화된 챗봇 시대를 넘어 실질적인 자율 수행 능력을 갖춘 차세대 에이전트 시대로 접어들고 있다는 평가다.