브라우저스택, QA 병목 해결할 'AI 테스트 에이전트' 5종 공개

| 김민준 기자

브라우저 테스트 플랫폼을 제공하는 브라우저스택(BrowserStack)이 소프트웨어 테스트 전(全) 과정의 자동화를 위한 인공지능(AI) 에이전트 제품군 '브라우저스택 AI'를 발표했다. 최근 소프트웨어 개발팀이 직면하는 테스트 병목 현상을 해소하고, 반복적인 작업에 투입되는 시간을 획기적으로 줄이기 위해 고안된 이 제품은 엔지니어링 워크플로우 전체에 AI를 통합하는 것을 목표로 한다.

이번에 공개된 브라우저스택 AI는 기획부터 테스트 실행 및 유지보수까지 단계별로 특화된 5종의 AI 에이전트로 구성돼 있다. 특히 기존의 범용 생성형 모델이 갖는 한계, 예컨대 UI 변경에 따라 자동화 테스트가 흔들리거나 플레이크 현상이 일어나는 문제를 극복하도록 설계된 점이 차별화 요소로 꼽힌다. 브라우저스택의 공동 창업자이자 CEO인 리테쉬 아로라(Ritesh Arora)는 “우리는 전체 테스트 여정을 세분화해 수작업이 가장 많이 필요한 부분을 AI로 대체했다”며 “새로운 테스트 케이스 생성기는 생성 속도를 90% 단축하면서도 91%의 정확도와 92%의 커버리지를 기록하고 있다”고 밝혔다.

주요 에이전트 중 하나인 테스트 케이스 생성기는 제품 요구사항 문서(PRD)와 유저 스토리를 분석해 다양한 시나리오 기반의 테스트 케이스를 자동으로 생성한다. 특히 엣지 케이스들을 식별하고, 비즈니스 로직의 타당성을 검증하는 등 복잡한 QA 작업을 AI가 대신 수행한다. 여기에 더해 '로우코드 작성 에이전트'는 작성된 테스트 케이스를 기반으로 최대 10배 더 빠르게 자동화 테스트 코드를 완성한다. 자연어 프롬프트를 직접 테스트 케이스로 변환하여 테스트 과정의 접근성을 크게 높였다.

테스트 유지관리 부문에서는 셀프 힐링(Self-Healing) 기능을 갖춘 에이전트가 눈길을 끈다. 이 기능은 테스트 실행 중 발생하는 UI 변경을 실시간으로 감지해 스크립트를 자동 조정한다. 이를 통해 테스트 자동화 실패율은 최대 40%까지 줄어들 수 있다고 회사 측은 전했다.

접근성 진단을 위한 ‘A11y 이슈 탐지 에이전트’는 콘텐츠 내 대체 텍스트 누락, 장식용 이미지 오용, 낮은 색 대비 등 다양한 WCAG 위반 요소를 파악해, 개발팀이 전문 지식 없이도 포괄적인 사용자 경험을 구현할 수 있도록 돕는다. 여기에 ‘비주얼 리뷰 에이전트’는 UI 변화 중 의미 없는 픽셀 단위 차이를 제거하고, 실제 사용성과 연관된 변화에만 집중해 분석 보고를 제공한다.

현재 공개된 5종 외에도 브라우저스택은 20개 이상의 AI 에이전트를 추가 개발 중이다. 이 에이전트들은 브라우저스택의 기존 제품군과 모두 통합돼 별도의 설치나 워크플로우 변경 없이 바로 사용할 수 있도록 설계됐다. 연결성과 확장성 또한 강화되었다. 브라우저스택 MCP 서버를 통해 개발자는 자신의 개발 환경이나 생성형 AI 도구에서 직접 테스트를 실행할 수 있다. GitHub Copilot이나 앤트로픽의 클로드, Cursor처럼 널리 사용되는 LLM 기반 도구들과의 연동도 가능하다.

이번 AI 에이전트 출시로 브라우저스택은 소프트웨어 품질 보증 분야에서 대규모 언어모델(LLM)의 한계를 명확히 인식하고, AI의 실질적 도입 효과를 제시한 기업으로 평가받고 있다. 소프트웨어 테스트 자동화의 난제를 푸는 실질적인 해법을 제공한 만큼 향후 브라우저스택 AI의 시장 반응에 이목이 집중된다.