자율 인공지능(AI) 시스템의 ‘실패 인텔리전스’ 계층을 제공하는 챗시AI(ChatSee.AI)가 시드 투자 650만달러를 유치했다. 원화로는 약 98억7675만원 규모다.
이번 투자는 트루벤처스가 주도했고, 퍼스트 레이즈 벤처 파트너스와 세븐힐스벤처스, 업계 주요 투자자들이 참여했다. 회사 측 발표는 현지시간 목요일 나왔다.
챗시는 기업용 AI 에이전트가 실제 업무에 투입된 뒤 발생하는 각종 오류를 추적하고, 수정 과정을 기록해 같은 문제가 반복되지 않도록 돕는 기술을 개발하고 있다. 단순히 ‘환각’ 현상만 감시하는 수준을 넘어, 도구 호출 실패와 업무 범위 설정, 추론, 실행 단계 전반의 미세한 오류까지 포착하는 데 초점을 맞췄다.
공동창업자이자 최고경영자(CEO) 세카르 사루카이는 실리콘앵글과의 인터뷰에서 “좋든 싫든 AI는 이미 기업 안으로 들어와 있다”고 말했다. 그는 이어 “AI 인프라는 비결정론적이기 때문에 테스트만으로 모든 실패를 막을 수 없다는 점을 기업들이 깨닫고 있다”고 설명했다.
실제 기업 현장에서는 마이크로소프트($MSFT)의 코파일럿, 데이터브릭스의 지니, 스노우플레이크, 워크데이, 오픈AI, 앤트로픽은 물론 자체 구축한 AI 에이전트까지 빠르게 확산하는 흐름이다. 여기에 오픈소스 생태계까지 커지면서 기업의 고민은 ‘구축 가능 여부’에서 ‘실제 고객과 직원 업무를 맡길 수 있느냐’로 옮겨가고 있다.
챗시는 이를 ‘신뢰 격차’로 보고 있다. 회사가 제시한 해법은 AI 에이전트가 언제 실패했는지 관찰하고, 당시 맥락과 인간의 수정 내역, 해결 방법을 함께 저장한 뒤 이를 다시 시스템에 반영하는 구조다. 쉽게 말해 에이전트 운영 과정에서 쌓이는 실패 사례를 일종의 ‘지식 베이스’로 만들어, 다른 에이전트도 이를 참고해 같은 실수를 피하도록 하겠다는 구상이다.
챗시에 따르면 이 시스템의 기반에는 1만건이 넘는 기업용 AI 에이전트 실패 사례가 있다. 회사는 이를 157개 범주로 분류해 오류 유형을 체계화했다. 기존 업계가 첫 번째 실패 유형인 ‘환각’에 집중했다면, 챗시는 보다 넓고 미묘한 운영 리스크를 겨냥하고 있다는 설명이다.
이 같은 접근이 주목받는 이유는 AI 에이전트의 역할이 달라지고 있기 때문이다. 과거에는 고객 응대용 챗봇이 중심이었다면, 최근에는 전자상거래와 금융서비스 등 핵심 업무로 범위가 넓어지고 있다. 상품 카탈로그 검증, 가격 책정, 거래 라벨링, 가맹점 코드 분류 같은 영역에서 에이전트가 의사결정을 내리기 시작하면서, 작은 오분류가 대규모 오류로 번질 수 있다는 우려도 커졌다.
사루카이는 “이제는 단순한 대화형 지원 에이전트가 아니라 핵심 비즈니스를 지원하는 에이전트”라고 말했다. 예를 들어 한 에이전트가 가맹점 코드를 미세하게 잘못 분류하고, 사람이 나중에 이를 바로잡았다면 그 수정 정보가 시스템 전반의 다른 에이전트에도 즉시 전파돼야 한다는 것이다.
챗시는 이런 수정 이력을 중앙 권한 체계에 기록해 다른 에이전트가 ‘모범 사례’처럼 조회할 수 있는 구조를 지향한다. 특정 에이전트가 반복적으로 도구 호출에 실패하거나, API 호출 방식이 바뀌어 오류가 생기더라도 인간의 교정 내용과 시스템 판단을 함께 학습해 재발을 줄이는 방식이다. 사루카이는 이를 두고 “지능이 사라지지 않도록 하는 것”이라고 설명했다.
시장 흐름도 챗시의 문제의식과 맞닿아 있다. 기업들이 더 많은 AI 에이전트를 배치하는 반면, 이를 둘러싼 운영 도구는 아직 초기 단계라는 평가가 나온다. 일부 스타트업은 실제 운영 환경에서 에이전트 성능을 분석하는 플랫폼을 만들고 있고, 다른 기업들은 사전 관측성과 근본 원인 분석에 집중하고 있다. 데이터 관측성 업체들 역시 AI 입력값과 출력값, 품질 모니터링 영역으로 빠르게 확장하는 추세다.
리서치 및 자문업체 TAG-인포스피어의 최고경영자 에두아르드 아모로소 박사는 “가장 중요한 AI 리스크 중 다수는 에이전트가 자율적으로 작동하는 실행 시점에 발생한다”며 “확률적이고 적응적인 시스템인 만큼 정적 테스트만으로는 충분하지 않다”고 진단했다. 그는 이런 변화가 기업 워크플로 전반에서 ‘지속적인 런타임 보증’ 수요를 키우고 있다고 짚었다.
챗시는 관측성이 ‘무슨 일이 일어났는지’를 알려주고, 평가는 ‘에이전트가 잘 수행했는지’를 판단한다면, 자사는 ‘무엇이 왜 실패했는지, 다시 막으려면 어떻게 해야 하는지’를 기억하는 계층이 되겠다는 목표를 내세우고 있다.
결국 AI 에이전트 시장은 ‘자가 학습’과 ‘자가 치유’ 방향으로 움직이고 있다. 앞으로 더 많은 에이전트가 서로 협업하고 인간과 함께 일하게 될수록, 과거 실패를 축적해 다음 행동에 반영하는 능력은 기업 AI 운영의 핵심 경쟁력으로 떠오를 가능성이 크다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
많이 본 기사