Ai2, 오픈소스 로봇 AI ‘몰모액트 2’ 공개…스탠퍼드 의대 실험실서 성능 시험

| 손정환 기자

미국 시애틀에 본사를 둔 인공지능 연구기관 Ai2, 앨런 인공지능 연구소가 현실 세계에서 작동하는 로봇을 겨냥한 오픈소스 기반 모델 ‘몰모액트 2(MolmoAct 2)’를 공개했다. 회사는 새 모델이 기존 자사 모델보다 최대 37배 빠르게 다양한 작업을 처리하고, 시중의 비공개 로보틱스 모델보다도 더 높은 성능을 보였다고 밝혔다.

Ai2는 지난해 8월 첫 행동 추론 모델인 ‘몰모액트(MolmoAct)’를 선보인 바 있다. 이 모델은 기계가 행동에 나서기 전 3차원 환경을 먼저 이해하고 추론하도록 설계된 것이 특징이다. 당시 22시간 분량의 자체 정제 데이터를 3개월 동안 학습해, 더 큰 폐쇄형 모델을 산업 표준 평가에서 앞설 수 있다는 점을 입증했다. 이번 몰모액트 2는 이 구조를 바탕으로 실제 환경 대응력을 한층 끌어올린 후속 모델이다.

처음부터 다시 설계한 구조…3D 추론과 행동 결합

Ai2는 이번 모델이 기존 비디오 이해 모델 ‘몰모 2’의 단순 확장판이 아니라고 설명했다. 대신 자사 기반 모델의 특화 버전인 ‘몰모 2-ER’를 토대로 아키텍처를 처음부터 다시 설계했다. 학습에는 이미지 기반 포인팅, 객체 탐지, 추상적 공간 추론, 다중 이미지 추론, 이미지·영상 기반 공간 질의응답 등 300만 건이 넘는 예제가 투입됐다.

이 덕분에 몰모액트 2는 내부에 특화된 ‘행동 전문가’ 모듈을 결합해 3D 추론을 바탕으로 로봇 행동을 생성할 수 있게 됐다. 쉽게 말해 로봇이 사물을 보고 위치와 관계를 파악한 뒤, 어떤 순서로 움직여야 하는지를 더 정교하게 판단하는 구조다.

720시간 규모 양팔 로봇 데이터 공개

Ai2는 모델과 함께 ‘몰모액트 2-바이매뉴얼 YAM’ 데이터셋도 공개했다. 회사는 이를 지금까지 공개된 오픈소스 수작업 데이터 가운데 최대 규모의 ‘양팔 로봇’ 시연 데이터라고 소개했다. 전체 학습 분량은 720시간 이상이다.

‘양팔’은 두 개의 로봇 팔이 함께 협업하는 작업을 뜻한다. 수건 접기, 장보기 물품 스캔, 스마트폰 충전, 테이블 정리처럼 실제 생활이나 산업 현장에서 자주 필요한 동작이 여기에 포함된다. 회사는 여기에 다른 로봇 데이터셋도 추가로 섞어 다양한 로봇 팔 구조, 카메라 배치, 제어 방식, 작업 스타일을 학습하도록 했다고 설명했다.

언어 데이터 품질도 손봤다. 반복적이거나 품질이 낮은 지시문을 줄이고 로봇 라이브러리를 재주석 처리해 고유 라벨 수를 7만1,000개에서 약 14만6,000개로 늘렸다. 이는 같은 작업이라도 다양한 표현을 더 잘 이해하도록 만들기 위한 조치다.

스탠퍼드 의대 유전자 편집 실험실서 시험

로봇 인공지능의 실제 경쟁력은 실험실이 아니라 현실 환경에서 갈린다. Ai2는 스탠퍼드대 의과대학의 르 콩(Le Cong) 교수 연구팀과 함께 몰모액트 2를 실제 ‘웻랩’ 환경에서 시험했다고 밝혔다. 이 연구실은 유전자 편집 기술 ‘크리스퍼(CRISPR)’ 관련 실험을 진행하는 곳이다.

유전자 실험은 시료를 옮기고, 피펫으로 액체를 분주하고, 장비를 정밀하게 다루는 반복 작업이 많다. 작은 실수가 누적되면 실험 전체가 실패로 이어질 수 있어 자동화 난도가 높은 분야로 꼽힌다. 연구진은 여러 범용 AI 모델을 해당 작업 흐름에 맞게 미세조정한 뒤 비교한 결과, 몰모액트 2가 웻랩 운영을 지원할 가능성을 강하게 보여줬다고 평가했다.

여전히 한계는 존재…오픈소스로 보완 속도 높인다

Ai2는 몰모액트 2가 재구성된 지시문, 물체 위치 변화, 방해 물체, 대체 물체 투입 같은 조건에서도 버틸 수 있는지 별도로 점검했다고 밝혔다. 이는 실제 현장에서 작업 조건이 계속 바뀌는 상황을 가정한 시험이다.

다만 한계도 분명하다고 인정했다. 다른 로봇 시스템과 마찬가지로 집게가 카메라 시야를 가릴 때, 로봇 팔의 물리적 속도가 제어 시스템을 따라가지 못할 때, 또는 더 정밀한 조작이 필요한 작업에서는 성능 저하가 나타날 수 있다는 것이다.

Ai2는 이런 문제를 공개적으로 드러내고 데이터셋과 모델을 함께 배포하는 방식이 로보틱스 전반의 발전에 도움이 된다고 보고 있다. 향후에는 새로운 기계와 환경에 맞게 조정할 수 있는 학습 코드도 공개할 계획이다. 폐쇄형 모델 중심이던 로봇 AI 시장에서 ‘오픈소스’가 성능과 확장성 모두를 입증할 수 있을지 주목된다.

TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.
본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

많이 본 기사

지금 꼭 알아야 할 리포트