일상적인 작업을 자동화할 수 있는 지능형 에이전트 시대가 성큼 다가왔다. 마이크로소프트(MSFT)가 새롭게 선보인 소형 언어모델 'Fara-7B'는 개인용 컴퓨터(PC)에 직접 설치해 실행할 수 있는 로컬 기반 AI 모델로, 특정 작업을 이해하고 수행하는 능력을 갖췄다는 점에서 주목된다.
Fara-7B는 이름에서 알 수 있듯 70억 개의 매개변수를 갖춘 경량 언어모델로, 마이크로소프트에 따르면 "컴퓨터 사용"에 최적화돼 개발됐다. 일반 대형 언어모델이 수십조 개의 매개변수를 필요로 하는 것과 달리, 이 모델은 사용자와 같은 방식으로 키보드와 마우스를 직접 조작하며 웹사이트 탐색, 제품 구매, 길 찾기 등 다양한 디지털 활동을 수행할 수 있다.
특히 흥미로운 점은 Fara-7B가 GPT-4o보다 일부 상황에서 더 뛰어난 성능을 발휘할 수 있다는 마이크로소프트의 주장이다. Fara-7B는 접근성 트리나 별도의 사전 데이터 없이 실제 사용자의 시각과 방식으로 웹을 탐색해 작동하며, 단일 모델만으로 에이전트 기능을 수행하는 능력을 보유하고 있다.
실제 데모 영상에서는 Fara-7B가 온라인 쇼핑, 정보 검색 후 요약, 지도상 위치 거리 계산 등의 작업을 수행하는 장면이 소개됐다. 다만 현재 속도는 느리고 중간중간 사용자 승인을 요하는 점에서 아직 상용화 단계를 완전히 넘지는 못했음을 시사한다. 마이크로소프트는 이러한 한계를 인정하면서도, 점차 속도와 정확도를 개선해 일상 속 디지털 비서를 목표로 삼고 있다.
Fara-7B는 클라우드 연결 없이도 실행 가능하다는 점에서 개인 정보 보호와 지연 시간 최소화 측면에서 강점을 지닌다. 모든 처리 과정은 사용자의 PC 내에서 이루어지며, 데이터가 마이크로소프트의 클라우드로 전송되지 않는다. 이는 기존 코파일럿(Copilot)이 클라우드 기반 AI 처리에 의존하는 구조와 비교했을 때 뚜렷한 차별점이다.
기술적으로는 마이크로소프트가 지난해 공개했던 스마트폰 실행 가능 모델 Phi-4의 연장선상에 있으며, 이번에는 보다 복잡한 작업 처리까지 가능하다. 그러나 여전히 완벽하지는 않다. 복잡한 명령을 처리할 때 오류를 범하거나 지시사항을 제대로 따르지 못하는 사례가 수차례 보고됐다. 마이크로소프트는 이를 이유로 초기 Fara-7B는 별도로 마련된 샌드박스 환경에서만 활용 가능하며, 악의적인 입력에 대응하기 위해 여러 보호 장치를 탑재했다.
Fara-7B는 현재 마이크로소프트 파운드리와 허깅페이스(Hugging Face)를 통해 MIT 라이선스로 공개됐으며, 마이크로소프트의 프로토타입 AI 플랫폼인 Magnetic-UI에서만 사용할 수 있다. 향후에는 Fara-7B를 윈도우11 코파일럿 플러스 PC에 최적화한 버전을 출시할 계획이라고 밝혔다.
Fara-7B는 단순히 소형화된 모델 이상의 의미를 지닌다. PC에서 실행 가능한 에이전트형 AI라는 점에서 컴퓨터 사용 방식의 근본적 전환을 예고하며, 마이크로소프트가 차세대 컴퓨팅 환경에서 어떤 주도권을 쥘지 여부를 가늠할 중요한 갈림길이 될 전망이다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>