AI 시대, '보이지 않는 오류' 막는다…허니콤이 주목받는 이유

| 김민준 기자

기업들이 인공지능(AI) 시스템을 도입하면서 관측 가능성(observability)을 구축하지 않은 채 운영하는 사례가 늘고 있다. 그러나 이처럼 내부 작동 상황이 불투명한 시스템은 예기치 못한 오류가 발생했을 때, 문제 해결이 어려운 치명적인 리스크로 이어질 수 있다. 이러한 취약점을 파고든 기업이 바로 허니콤(Honeycomb)이다.

오픈소스 프레임워크인 오픈텔레메트리(OpenTelemetry)를 기반으로 구축된 허니콤의 플랫폼은 AI가 어떻게 작동하고 있는지를 시각화하고 분석할 수 있는 방식으로 설계됐다. 최근 ‘KubeCon + CloudNativeCon NA 2025’ 행사에 참석한 허니콤 제품총괄 부사장 그레이엄 시너(Graham Siener)는 “사람들이 각기 다른 도구로 분산됐던 데이터를 하나의 통합된 지점으로 모으려고 한다”며, 관측 가능성의 중요성이 커지고 있음을 강조했다.

시너 부사장은 기존 레거시 시스템을 AI로 리빌딩하는 과정에서 가장 큰 문제는 개발자들이 생성된 AI 코드의 작동 원리를 잘 모른다는 데 있다고 밝혔다. 일명 ‘바이브 코딩(vibe coding)’이라 불리는 방식으로 빠르게 프로덕션 단계에 진입할 수는 있지만, 문제 발생 시 어느 지점에서 오류가 발생했는지를 파악하기 어렵다는 것이다. 이 때문에 허니콤의 관측 툴이 제 기능을 발휘한다.

실제 듀오링고(Duolingo)가 허니콤의 대표적인 고객 사례다. 듀오링고는 챗봇의 대화 흐름을 디버깅할 때 프롬프트와 토큰의 실행 흐름 전반을 시각적으로 파악할 수 있다는 점에서 큰 효과를 보고 있다는 후문이다. 시너 부사장은 이처럼 “자신들이 가지고 있는 데이터를 더 깊이 이해할수록 문제 해결 속도도 한층 빨라진다”고 설명했다.

빠르게 변화하는 AI 생태계 안에서, 관측 가능성 플랫폼은 단순히 부가적인 기능이 아닌 핵심 역량으로 진화하고 있다. 허니콤이 주목받는 이유도 여기에 있다. AI가 기존 시스템의 한계를 뛰어넘기 위해서는, 그 기초부터 데이터를 정확히 들여다볼 수 있는 기술적 신뢰가 수반되어야 하기 때문이다.