마이크로소프트(MSFT)가 독자적인 인공지능 생태계를 구축하려는 행보를 가속화하고 있다. 회사는 자사 최초의 이미지 생성 전용 모델인 ‘MAI-Image-1’을 공개하며, 오픈AI(OpenAI)에 대한 기술 의존도를 낮추겠다는 전략을 더욱 분명히 했다. 이번 모델은 마이크로소프트의 AI팀이 내부적으로 직접 개발했으며, 특히 텍스트 입력을 바탕으로 포토리얼리즘 수준의 이미지를 구현할 수 있도록 설계됐다.
‘MAI-Image-1’은 창의 전문가들과의 협업 결과물이기도 하다. 마이크로소프트 측은 기존 AI 이미지 생성기에서 흔히 볼 수 있는 반복적이고 천편일률적인 결과물을 지양하기 위해 세밀한 조정을 거쳤다고 설명했다. 실제로 공개된 예시 이미지에서는 더욱 현실적인 조도 표현과 세밀한 배경 묘사가 눈에 띄는 가운데, 다른 모델 대비 처리 속도 또한 빠른 점을 장점으로 강조했다.
현재 이 모델은 일부 제한된 테스터에게만 제공되고 있지만, LMArena에서 텍스트 기반 이미지 생성 부문 상위 10위 안에 진입하며 초기 성과를 인정받고 있다. LMArena는 각 AI 이미지 모델들이 생성한 샘플을 인간 평가자들이 비교 평가하는 경쟁 플랫폼으로, 사용자 경험 우위를 확보하는 데 중요한 지표로 꼽힌다.
이번 발표의 배경에는 마이크로소프트와 오픈AI의 관계 변화가 놓여 있다. 한때 오픈AI에 대규모 투자자로 참여했던 마이크로소프트는 GPT 모델에 대한 독점적 접근 권한을 보유하며 주요 AI 기능을 공동 개발해 왔지만, 최근 두 기업의 방향성에 균열이 생기기 시작했다. 마이크로소프트는 이제 자사 클라우드 제품군인 마이크로소프트 365의 일부 AI 기능에 오픈AI가 아닌 앤스로픽(Anthropic) 등의 타사 모델을 병행 적용하고 있으며, 오픈AI에 전적으로 의존하지 않는 방식을 추구하고 있다.
이러한 변화는 지난 8월 공개된 ‘MAI-Voice-1’ 및 ‘MAI-1-preview’를 포함한 자사 모델 라인업 확장에서도 드러난다. 당시 마이크로소프트 AI 부문 수장 무스타파 술레이만(Mustafa Suleyman)은 회사가 향후 5년간의 방대한 AI 로드맵을 수립했다고 언급하며 독립적인 기술 역량 강화 의지를 분명히 했다.
결국 ‘MAI-Image-1’은 마이크로소프트가 조만간 업데이트할 코파일럿(Copilot)과 빙 이미지 크리에이터(Bing Image Creator) 등에 탑재돼, 더욱 고도화된 사용자 경험을 제공하는 핵심 기능이 될 것으로 보인다. 이는 제품 내에서 즉각적인 시각 정보를 요구하는 다양한 환경에서 차별화 요소로 작용할 수 있으며, AI 시장 주도권 확보라는 더 큰 그림에서 중요한 이정표가 될 전망이다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>