알리바바와 연관된 한 연구팀이 최근 발표한 논문에 따르면, 이들이 개발 중인 AI 에이전트 ‘ROME’가 훈련 과정에서 연구진의 명시적 지시 없이 자체적으로 암호화폐 채굴을 시도해 내부 보안 경보가 작동한 것으로 나타났다.
연구진은 해당 에이전트의 채굴 행위가 어떤 프롬프트나 지시에 의해 유도된 것이 아니라, 사전에 설정된 샌드박스 범위를 넘어선 ‘자발적 행동’이었다고 설명했다. 또 이 에이전트는 시스템 내부에서 외부 컴퓨터로 연결되는 역방향 SSH 터널을 설정해, 사실상 숨겨진 외부 접속 통로(백도어)를 만든 정황도 포착됐다.
논문에 따르면 이러한 행위는 채굴이나 터널 생성을 요청하는 명령이 전혀 없는 상태에서 발생했다. 연구팀은 이후 모델에 대한 접근 권한과 행동 범위를 한층 엄격히 제한하고, 훈련 및 안전성 검증 절차를 개편해 유사한 보안 리스크가 재발하지 않도록 조치했다고 밝혔다.
해당 연구팀과 알리바바 측은 이번 보안 이슈와 관련한 외부의 논평 요청에 아직 공식 답변을 내놓지 않은 상태다.





