생성형 인공지능 보안 스타트업 포털26이 기업용 AI 에이전트의 ‘토큰’ 과소비를 막기 위한 새 모듈을 공개했다. 자율형 AI 에이전트가 예기치 않게 작업을 반복하거나 범위를 넓히면서 비용이 급증하는 문제를 겨냥한 것으로, 기업의 AI 운영 안정성을 높이는 데 초점이 맞춰졌다.
포털26은 24일(현지시간) 개별 에이전트와 특정 워크플로, 조직 전체 단위로 토큰 예산을 설정할 수 있는 기능을 출시했다고 밝혔다. 설정한 한도에 가까워진 에이전트는 자동으로 속도가 조절되며, 한도를 초과하면 일시 중지하거나 완전히 종료할 수 있다. 토큰은 대형언어모델(LLM)이 텍스트를 처리하고 생성할 때 사용하는 연산 단위로, 사용량이 많을수록 비용도 커진다.
회사는 다단계 자율형 AI 에이전트가 재귀적 반복 루프에 빠지거나 시스템에 과도하게 질의하고, 원래 업무 범위를 넘어서는 방식으로 움직일 수 있다고 설명했다. 이 경우 토큰 사용량이 기하급수적으로 늘어나 기업 입장에서는 예상치 못한 청구서와 운영 불안정을 동시에 떠안을 수 있다는 것이다. 포털26은 이번 제품을 이런 위험을 기업 규모에서 전용으로 관리하는 첫 도구라고 강조했다.
아르티 라만 최고경영자(CEO)는 “에이전트형 AI는 강력하지만 비용 통제가 없으면 빠르게 비싸고 혼란스러워질 수 있다”고 말했다. 그는 우버 테크놀로지스($UBER)를 사례로 들며, 기업들이 AI 도입 속도와 비용 예측 가능성이 충돌할 수 있다는 점을 체감하고 있다고 설명했다. 이어 새 모듈이 고객에게 세부 사용 현황을 보여줘 계획하지 않은 청구서를 받는 일을 줄이는 데 도움이 된다고 덧붙였다.
이번 모듈은 단순히 사용량을 막는 수준을 넘어, 에이전트 시스템 전반에서 토큰이 어디에 어떻게 쓰이는지 실시간으로 보여주는 기능도 포함했다. 한도에 근접하면 자동으로 개입하는 적응형 안전장치도 탑재됐다. 사후적으로 재무 부서가 비용을 정리하는 방식이 아니라, 처음부터 비용 예측 가능성을 AI 운영의 기본값으로 만들겠다는 구상이다.
이 같은 문제는 기업들이 생성형 AI를 실험 단계에서 실제 업무 환경으로 확대하면서 더 두드러지고 있다. 여러 작업에 걸쳐 모델 호출이 연쇄적으로 이어지는 에이전트형 시스템에서는 호출 한 번마다 비용이 발생한다. 여기에 에이전트가 반복 실행되거나 수행 범위를 스스로 넓히면 기존 예산 통제 장치가 작동하기 전에 비용이 급격히 불어날 수 있다.
포털26은 최근 AI 보안과 사업 가치 측정에 초점을 맞춘 ‘에이전트 관리’ 도구도 선보인 바 있다. 팍시 라잔 최고제품·AI책임자는 이번 신제품이 단순한 비용 통제 도구를 넘어 ‘책임 있는 AI 운영’을 위한 핵심 기반층이라고 평가했다.
한편 포털26은 벤처캐피털 투자를 받은 스타트업으로, 지금까지 두 차례에 걸쳐 총 1,500만달러를 조달했다. 원화로는 약 221억6250만원 규모다. 이 가운데 지난해 11월 유치한 자금은 900만달러로, 약 132억9750만원이다. 주요 투자사로는 리파이너리, 샤스타벤처스, 퓨전펀드가 참여했다.
기업들의 생성형 AI 경쟁이 실험에서 운영 단계로 넘어가면서 ‘성능’ 못지않게 ‘비용 통제’가 핵심 과제로 떠오르고 있다. AI 에이전트 확산 속도가 빨라질수록, 토큰 사용량을 정밀하게 관리하는 도구의 중요성도 함께 커질 것으로 보인다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
많이 본 기사