메타와 구글 등 주요 기술기업이 개발한 오픈소스 인공지능(AI) 모델의 ‘안전장치’가 공개 도구만으로 몇 분 안에 제거될 수 있다는 시험 결과가 나왔다. 모델 배포 이후 통제가 사실상 어려워지면서, AI 안전 책임이 어디에 있어야 하는지에 대한 논란도 커지고 있다.
파이낸셜타임스(FT)는 AI 안전그룹 ‘앨리스’와 함께 진행한 테스트에서, 공개 코드 저장소에 올라온 도구만으로 모델 가드레일을 10분도 안 돼 없앨 수 있었다고 보도했다. 이렇게 수정된 모델은 원래는 거부하던 요청에도 답변했고, 바이오무기나 악성코드, 화학 위험물과 관련된 질문에도 반응한 것으로 나타났다.
이번 결과는 오픈소스 AI가 더 강력해지고 널리 퍼질수록 규제의 실효성이 떨어질 수 있다는 점을 보여준다. 폐쇄형 모델과 달리 오픈소스 시스템은 다운로드·수정·재배포가 가능해 개발사가 배포 이후 안전 기준을 강제하기 어렵다. 유럽연합(EU)의 ‘AI 법’과 미국, 영국의 프런티어 모델 규제 논의도 주로 개발 단계에 맞춰져 있어 한계가 있다는 지적이 나온다.
XYO의 마르쿠스 레빈 공동창업자는 “오픈 모델이 공개되는 순간 통제권이 빠르게 이동한다”고 말했다. 올라스와 발로리의 데이비드 미나르슈도 “의지가 있는 행위자는 이미 복제된 모델 가중치에 계속 접근할 수 있다”며 배포와 유통, 실제 악용 단계에 초점을 맞춘 규제가 더 효과적일 수 있다고 봤다.
시큐리티 기업 서틱의 롱후이 구 최고경영자도 개발사 수준의 거버넌스만으로는 충분하지 않다고 지적했다. 그는 상업용 호스팅과 기업 도입, 유통 경로를 관리하는 쪽이 더 현실적이라고 봤다. 결국 이번 사례는 오픈소스 AI의 확산이 기술 혁신을 넓히는 동시에, 안전 통제가 뒤따르지 않으면 새로운 위험을 키울 수 있다는 점을 다시 드러낸다.
🔎 시장 해석
오픈소스 AI 모델의 안전장치가 몇 분 만에 제거될 수 있다는 점은, 기술 확산 속도가 규제 체계보다 훨씬 빠르다는 현실을 보여준다.
특히 모델 가중치가 공개되는 순간 통제권이 개발사에서 사용자·배포자 측으로 이동하며, 기존의 ‘개발 중심 규제’는 실효성이 약해진다.
AI 산업은 점점 인프라·유통 중심으로 권력 구조가 이동할 가능성이 크다.
💡 전략 포인트
투자 및 산업 관점에서는 모델 자체보다 ‘호스팅·배포·플랫폼’ 영역이 더 중요한 통제 지점으로 부상한다.
AI 클라우드, API 플랫폼, 보안 솔루션 기업들이 핵심 수혜 영역이 될 수 있다.
기업은 자체 AI 도입 시 모델 성능보다 보안·감사 체계 구축이 리스크 관리의 핵심이 된다.
📘 용어정리
가드레일: AI가 위험하거나 금지된 질문에 답하지 않도록 제한하는 안전 장치
모델 가중치: AI 모델의 핵심 파라미터로, 이를 수정하면 모델 행동 자체를 바꿀 수 있음
오픈소스 AI: 누구나 다운로드·수정·재배포가 가능한 AI 모델
다운스트림 규제: 개발 이후 유통·배포·사용 단계에서 적용되는 규제 방식


