인공지능 스타트업 리플렉션 AI(Reflection AI)가 슈퍼지능(superintelligence) 달성을 앞당기기 위해 기존 코드 생성 중심의 방식을 탈피한 새로운 자동 코딩 에이전트를 선보였다. 회사가 개발한 에이전트 ‘아시모프(Asimov)’는 단순한 코드 분석을 넘어서, 비즈니스 전반의 데이터를 통합적으로 학습해 소프트웨어의 목적과 설계 의도를 이해하는 방식으로 설계됐다.
리플렉션 AI의 공동창업자이자 CEO인 미샤 라스킨(Misha Laskin)은 최근 인터뷰에서 “단지 코드만이 아니라 이메일, 슬랙 메시지, 프로젝트 메모 등 개발자들이 실제로 남긴 거의 모든 정보를 읽고 분석한다”며 “이러한 맥락을 학습함으로써 AI가 개발 과정의 전반을 이해하고 더 정교한 소프트웨어 생산이 가능해진다”고 설명했다. 이는 기존 주요 AI 회사들이 코드 생성 능력에 치중해온 방식과는 뚜렷한 차이를 보인다.
아시모프의 구조는 단일 에이전트가 아닌, 사용자 기업의 클라우드 환경에 배포된 복수의 소형 에이전트로 구성된다. 이들은 각기 데이터 수집과 질의 응답 역할을 맡으며, 이들이 조율되어 작동하는 방식이다. 수집된 정보를 종합하는 ‘추론 에이전트’가 중심에서 상황을 이해하고 최적의 응답을 생성하는 알고리즘 구조를 갖췄다.
리플렉션 AI의 공동창업자인 이오안니스 안토노글루(Ioannis Antonoglou)는 구글(GOOGL) 산하 딥마인드(DeepMind) 출신의 엔지니어로, 세계적인 AI 시스템 ‘알파고(AlphaGo)’의 개발에 주도적으로 참여한 인물이다. 그는 알파고에서 사용한 강화학습(reinforcement learning)을 아시모프에도 적용했다. 즉, 올바른 출력을 생성할 시 보상을 주고, 잘못된 출력은 페널티를 주는 방식으로 훈련시켜 AI의 판단력을 향상시키는 것이다.
안토노글루는 “구글의 디프 리서치(Deep Research)가 다양한 웹 정보를 종합해 리포트를 작성하는 것과 유사하게, 아시모프는 개발자 조직 내부의 문서와 메시지를 정리해 코딩 목적과 구조를 이해한다”고 밝혔다. 실제로 그는 “대규모 엔지니어링 조직에서는 중요한 지식이 코드 외부에 흩어져 있는 경우가 많다”고 덧붙였다.
아시모프의 실효성에 대해서는 회사가 자체적으로 시행한 초기 테스트 결과가 공개됐다. 오픈소스 개발자들을 대상으로 진행한 이 조사에서, 참가자의 82%가 아시모프의 코드 응답이 경쟁 모델보다 선호된다고 응답했다. 같은 조건에서 앤스로픽(Anthropic)의 클로드 소넷4(Claude Sonnet 4)는 63%의 만족도를 기록했다.
다만 이 결과는 오픈AI(OpenAI)나 깃허브(GitHub)의 코파일럿(CoPilot), 혹은 코그니션 AI(Cognition AI)의 데빈(Devin) 같은 코드 특화 모델들과의 비교가 빠진 제한적인 테스트라는 점에서 신중한 해석이 필요하다는 지적도 나온다.
MIT 컴퓨터과학과의 대니얼 잭슨 교수는 “비정형 데이터를 활용한 접근 구조는 매우 흥미롭고 가능성을 보여주는 시도”라고 평가하면서도, “프라이버시 이슈는 분명 고려해야 할 문제”라고 지적했다. 특히 내부 커뮤니케이션과 민감한 문서까지 AI가 학습한다는 점에서 윤리적 검토가 필요하다는 설명이다.
리플렉션 AI는 아시모프를 단순한 코딩 지원 툴이 아닌, 조직 전반의 디지털 지식을 축적하고 새로운 제품을 자율적으로 설계하는 코딩 오라클로 진화시킨다는 장기 목표를 내세우고 있다. 슈퍼지능을 향한 AI 에이전트 경쟁이 본격화되는 가운데, 리플렉션 AI의 전략이 얼마나 현실화될 수 있을지 주목된다.