기업의 업무 현장에 인공지능(AI) 에이전트가 빠르게 퍼지면서, 이제는 사람과 디지털 노동자를 함께 관리하는 체계가 핵심 과제로 떠오르고 있다. IBM은 이런 변화에 맞춰 AI 에이전트의 ‘채용’부터 ‘배치’, ‘평가’, ‘퇴출’까지 아우르는 ‘디지털 워커 라이프사이클’을 전면에 내세웠다.
모하마드 알리 IBM 컨설팅 수석부사장은 미국 보스턴에서 열린 ‘싱크 2026’ 행사에서, 기업이 사람을 인사관리(HR) 하듯 AI 에이전트도 같은 수준의 통제와 운영 원칙 아래 둬야 한다고 밝혔다. 이 구상은 약 3년 전 아르빈드 크리슈나 IBM 최고경영자(CEO)의 주문에서 시작됐다. 사람과 디지털 노동자가 나란히 일하는 환경을 관리할 소프트웨어 계층을 만들라는 과제였다.
알리에 따르면 IBM의 접근 방식은 단순히 AI 에이전트를 배포하는 수준에 그치지 않는다. IBM 컨설팅 어드밴티지 플랫폼에서는 현재 450개 활성 프로젝트에 걸쳐 4000개 이상의 디지털 직원이 운영되고 있다. 이 시스템은 AWS 고브클라우드 등 보안 환경에서 돌아가며, IBM 왓슨엑스(watsonx), 앤트로픽, 오픈AI 등 서로 다른 AI 모델과 스택을 쓰더라도 하나의 공통 관리 계층으로 묶어 가시성과 통제를 확보하는 구조다.
특히 IBM은 활용되지 않는 AI 에이전트를 그대로 두지 않는다는 점을 강조했다. 실제 업무에서 쓰이지 않는 에이전트는 토큰 공급을 끊고 결국 ‘은퇴’시키는 방식이다. 알리는 “아무도 쓰지 않는 에이전트는 결국 서비스를 종료한다”며 “토큰을 받지 못하면 자연스럽게 퇴출된다”고 설명했다. AI 도입이 늘어날수록 ‘생성’보다 ‘정리’와 ‘통제’가 더 중요해질 수 있다는 뜻으로 읽힌다.
IBM이 영국 교육기업 피어슨과 진행 중인 자격 검증 작업도 주목된다. 양사는 피어슨의 ‘크레들리’ 플랫폼을 활용해 AI 에이전트에 직접 기술 배지를 부여하는 방안을 시험하고 있다. 대상은 클라우드 기초나 보안 같은 실무 역량이다. 단순 암기형 평가가 아니라, 에이전트가 한 번도 풀어보지 않은 워크플로 문제를 해결하도록 하고 다른 에이전트가 그 수행 과정을 채점하는 식이다.
이는 AI 에이전트의 ‘실력’을 어떻게 검증할 것인가라는 시장의 핵심 질문에 대한 하나의 답이다. 교재를 그대로 주면 정답만 외워 맞힐 수 있기 때문에, 실제 업무 흐름에 가까운 문제 해결 능력을 기준으로 삼겠다는 접근이다. 향후 기업이 디지털 직원의 권한을 차등 부여하거나 민감한 업무 접근을 허용할 때 이런 자격 체계가 일종의 기준점이 될 가능성이 있다.
IBM은 자사 사례를 통해 사업 효과도 제시했다. 회사는 2024년부터 2025년 사이 컨설팅 부문 이익이 20% 늘었다고 밝혔다. 배경에는 전체 운영을 490개 워크플로로 쪼갠 뒤, 이 가운데 70개를 다시 설계하고 AI를 체계적으로 적용한 과정이 있었다. 알리는 IBM이 250억달러 규모 지출 가운데 생산성 향상을 통해 45억달러를 절감했다고 설명했다. 원화로 환산하면 약 6조770억 원 규모다.
고객사 사례도 공개됐다. 미국의 비영리 의료기관 프로비던스 헬스 앤 서비스는 오라클 시스템과 연동된 왓슨엑스 기반 HR 에이전트를 도입한 뒤 간호사 채용 기간을 12일 단축했다. 이는 기업용 AI의 가치가 단순 라이선스 확대가 아니라, 실제 업무 단위의 재설계에서 나온다는 점을 보여주는 사례로 해석된다.
이번 발표는 AI 도입 경쟁이 이제 ‘어떤 모델을 쓰느냐’에서 ‘어떻게 운영하고 검증하느냐’로 이동하고 있음을 시사한다. 기업 입장에서는 AI 에이전트를 많이 만드는 것보다, 어떤 역할을 맡기고 어떤 기준으로 평가하며 언제 퇴출할지를 정하는 관리 체계가 더 중요해지고 있다. IBM은 그 운영 표준을 선점하려는 쪽에 가깝다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

