기업들의 인공지능(AI) 투자 확대가 기술 스택 전반에 새로운 ‘데이터 표준화’ 과제를 던지고 있다. 그래픽처리장치(GPU) 클러스터와 AI 팩토리, 토큰 기반 과금 모델이 빠르게 늘고 있지만, 기존 클라우드 청구 체계만으로는 이를 일관되게 관리하기 어렵다는 지적이 나온다.
미국 샌디에이고에서 열린 ‘핀옵스 X 2026(FinOps X 2026)’에서는 이런 문제를 풀 핵심 도구로 ‘FOCUS’가 부상했다. FOCUS는 ‘핀옵스 오픈 비용 및 사용 명세’로, 멀티클라우드 환경에서 서로 다른 청구 데이터를 같은 형식으로 맞추기 위한 개방형 표준이다. 핀옵스 재단에 따르면 연간 1억달러 이상, 원화 약 1,521억6000만원을 지출하는 기업 가운데 약 68%가 이미 FOCUS 형식 데이터를 사용하거나 시험 적용 중이다.
멀티클라우드 넘어 AI 비용까지…FOCUS 1.4 확장
핀옵스의 데이터 엔지니어링 총괄 숀 앨페이(Shawn Alpay)는 현재 가장 큰 문제로 ‘표준 부재’를 꼽았다. 그는 클라우드, AI, 서비스형소프트웨어(SaaS) 등 각 기술 영역과 사업자마다 데이터 구조와 명칭이 달라, 기업이 비용을 한눈에 비교하거나 통합 분석하기 어렵다고 설명했다.
앨페이는 “같은 컬럼 이름, 같은 허용값 정의로 모든 사업자의 데이터를 같은 방식으로 설명할 수 있다는 점이 매우 중요하다”며 “이를 데이터 레이크나 데이터 웨어하우스로 바로 연결할 수 있으면 분석과 회계, 재무 업무에 걸리는 시간을 크게 줄일 수 있다”고 말했다.
이번 행사에서 공개된 FOCUS 1.4는 기존 퍼블릭 클라우드 중심 구조를 넘어 더 넓은 데이터셋과 사용자군을 겨냥하고 있다. 핀옵스의 수석 제품 관리자 맷 카우서트(Matt Cowsert)는 FOCUS가 이제 데이터 엔지니어나 핀옵스 실무자뿐 아니라 재무, 경영진, 조달 조직까지 함께 쓰는 ‘공통 언어’로 진화하고 있다고 밝혔다.
그는 “FOCUS는 조직 전체가 공유할 수 있는 언어”라며 “추가적인 조직 구성원들도 FOCUS에서 어떤 가치를 얻을 수 있는지 알 수 있도록 설계를 다듬어 왔다”고 말했다.
AI 토큰 경제학이 새 변수…‘추론 비용’ 측정 더 복잡해져
가장 까다로운 영역은 ‘AI 토큰 경제학’이다. 생성형 AI 서비스의 비용은 단순한 서버 사용량이 아니라 사용자별, 세션별, 요청별, 작업별로 잘게 쪼개 추적해야 하는 경우가 많다. 특히 추론 비용은 실제 서비스 구간에서 얼마나 많은 요청과 토큰이 소비됐는지를 세밀하게 봐야 해 데이터 양과 복잡도가 급격히 커진다.
앨페이는 이런 구조에서 데이터의 ‘카디널리티’, 즉 구분해야 할 항목 수가 폭증한다고 설명했다. 사용자 단위, 세션 단위, 요청 단위로 내려갈수록 수집·정제·저장해야 할 데이터가 크게 늘고, 그 자체가 또 다른 비용이 된다는 것이다.
그는 “AI와 토큰 영역으로 가면 사용자당, 세션당, 요청당, 작업당 비용을 보게 된다”며 “이 단계가 세분화될수록 데이터를 모으는 일은 훨씬 더 어려워진다”고 말했다. 이어 “데이터를 수집하고 파이프라인에 태워 비용 구조를 설명하는 것 자체가 결코 ‘제로 비용’이 아니다”라며 “소비자가 그 정도 세분화된 데이터를 실제로 볼지 선택할 수 있게 하는 방식도 고민해야 한다”고 덧붙였다.
개방형 표준이 해법 될까…관측 데이터 체계와 연동 검토
핀옵스 작업그룹은 AI 비용 관리에 대응하기 위해 새로운 관측 데이터셋을 별도로 만들지, 아니면 오픈텔레메트리(OpenTelemetry) 같은 기존 프레임워크와 연동할지를 검토 중이다. 이는 단순한 청구서 정리 차원을 넘어, AI 인프라 운영과 재무 통제를 연결하는 문제로 확장되고 있다.
FOCUS의 확장은 결국 기업들이 GPU 인프라, AI 서비스, 토큰 기반 소비 모델을 하나의 재무 체계 아래 묶을 수 있을지와 직결된다. AI 도입 속도가 빨라질수록 비용을 ‘얼마나 썼는가’보다 ‘어디서 왜 새고 있는가’를 설명할 수 있는 표준 언어의 중요성은 더 커질 전망이다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

