아마존웹서비스(Amazon Web Services)가 기업의 ‘AI 비용 거버넌스’를 정조준한 새 자동화 도구를 내놨다. 생성형 AI 도입이 빨라질수록 예측하기 어려운 토큰 기반 비용이 커지고 있는 만큼, AWS는 이를 실시간으로 감시하고 원인을 추적하는 ‘FinOps 에이전트’로 대응에 나선 모습이다.
AWS는 최근 ‘FinOps X 2026’에서 기능 프리뷰 형태로 FinOps 에이전트를 공개했다. 이 도구는 클라우드 비용을 상시 모니터링하고, 이상 지출을 탐지한 뒤 원인 분석까지 수행한다. 이후 관련 경고를 슬랙이나 지라로 담당 팀에 바로 전달한다. 기존처럼 월말 정산 보고를 기다리지 않고 비용 문제를 즉시 다룰 수 있도록 설계된 것이 핵심이다.
제리 라피사르다(Jerry Rapisarda) AWS 비용 관리·최적화 총괄 디렉터는 현지 인터뷰에서 이 도구가 숙련된 FinOps 실무자에게는 시간 절감 수단이 되고, 별도 비용 관리 인력이 없는 중소 조직에는 실질적인 운영 보조 역할을 할 수 있다고 설명했다. 그는 “핵심은 ‘지능’에 있다”며 “기업의 비즈니스 맥락을 이해하고 클라우드 비용을 관리하도록 돕는 것”이라고 말했다.
AI 비용, 왜 기존 클라우드 관리와 다른가
이번 발표의 배경에는 AI 비용 구조의 불확실성이 있다. 전통적인 클라우드 자원은 사용량과 비용을 비교적 예측하기 쉬웠지만, AI 워크로드는 다르다. 같은 에이전트 호출이라도 시스템 설계 방식에 따라 2만 토큰이 들 수도 있고, 200만 토큰이 소모될 수도 있어서다.
이 때문에 AI 비용 거버넌스는 단순히 인프라 태깅이나 사용량 집계만으로 해결되지 않는다. 기업은 호출 1건당 비용, 즉 ‘단위 경제성’을 계산하고, 이를 실제 사업 성과와 연결해야 한다. 예를 들어 챗봇 1회 호출에 3센트가 들고 전환율이 4%라면, 그 지출이 매출에 어떤 결과를 내는지까지 추적해야 의미 있는 비용 통제가 가능하다는 설명이다.
이는 AI 확산 국면에서 기업의 클라우드 전략이 단순한 ‘절감’에서 ‘성과 대비 효율’ 중심으로 이동하고 있음을 보여준다. 특히 생성형 AI는 사용량이 늘수록 비용도 선형적으로 증가하지 않을 수 있어, 기존 예산 체계만으로는 대응이 어렵다는 지적이 꾸준히 제기돼 왔다.
베드록 연계로 모델별 토큰 비용 비교
AWS는 자사 생성형 AI 플랫폼인 베드록(Bedrock)에서도 비용 관리 기능을 강화하고 있다. 고객은 모델별 토큰당 비용을 비교할 수 있고, ID 및 액세스 관리 역할별로 비용을 배분할 수 있다. 이를 통해 실험용 ‘샌드박스’ 환경과 실제 서비스용 운영 환경에 어떤 모델을 배치할지 보다 정교하게 나눌 수 있다는 게 AWS의 설명이다.
이 접근은 기업이 비싼 고성능 모델을 무분별하게 운영 환경에 쓰기보다, 업무 목적과 비용 효율에 맞춰 모델을 고르는 방향으로 이어질 가능성이 크다. 결국 AI 비용 거버넌스는 인프라 관리가 아니라 모델 선택, 서비스 설계, 수익성 분석까지 아우르는 문제로 확대되고 있다.
완전 자율화보다 ‘사람이 개입하는 자동화’ 강조
AWS는 이번 FinOps 에이전트를 완전 자율형이 아니라 ‘사람이 개입하는 구조’로 설계했다. 비용 관련 조치를 AI가 자동으로 실행하는 데는 아직 업계 전반의 신뢰가 충분히 쌓이지 않았다는 판단이 반영됐다.
라피사르다는 “에이전트가 완전히 자율적으로 행동하려면 그에 앞서 신뢰의 축적 과정이 필요하다”며 “모두가 그 여정을 지나고 있다”고 말했다. 이는 AI 자동화가 빠르게 확산하는 가운데서도, 비용과 운영에 직결된 의사결정은 당분간 인간의 검토를 전제로 할 가능성이 크다는 의미로 읽힌다.
AWS의 이번 행보는 AI 도입 경쟁이 이제 성능을 넘어 ‘비용 통제’ 단계로 진입했음을 보여준다. 기업 입장에서는 얼마나 똑똑한 AI를 쓰느냐만큼, 그 AI가 얼마를 쓰고 어떤 수익을 만들어내느냐가 중요해지고 있다. 클라우드 시장에서도 AI 비용 거버넌스가 새로운 경쟁 축으로 떠오를 가능성이 커 보인다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

