맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

MS, 초거대 AI 뛰어넘은 ‘Phi-4’ 공개… 140억 파라미터로 구조 추론 ‘압도’

작성자 이미지
김민준 기자
1
1

마이크로소프트가 140억 파라미터 규모의 오픈소스 모델 'Phi-4-Reasoning-Plus'를 출시했다. 소형 모델임에도 초거대 AI 성능을 능가하며 고도화된 추론 기능을 제공한다고 밝혔다.

MS, 초거대 AI 뛰어넘은 ‘Phi-4’ 공개… 140억 파라미터로 구조 추론 ‘압도’ / TokenPost Ai

마이크로소프트(MSFT)가 고도화된 구조적 추론 능력을 갖춘 차세대 AI 모델 ‘Phi-4-Reasoning-Plus’를 출시했다. 이 모델은 오픈소스로 공개되며, 작은 규모에도 불구하고 수십억 개의 파라미터를 가진 대형 모델 못지않은 성능을 발휘하는 것이 특징이다.

이번에 공개된 Phi-4-Reasoning-Plus는 파라미터 수가 140억 개에 달하는 디코더 기반 트랜스포머 모델로, 수학, 과학, 코딩, 논리 기반 과제에서 탁월한 추론 성능을 보인다. 마이크로소프트 연구진은 총 160억 개 토큰으로 모델을 학습시켰으며, 이 중 83억 개가 중복되지 않은 유니크 데이터였다. 데이터는 모두 웹 기반 자료와 합성 데이터로 구성됐다. 특히 모델은 6,400개 수준의 수학 관련 문제에 대한 강화학습 단계를 거쳐 고차원의 추론 능력을 더욱 정제했다.

모델은 MIT 라이선스를 바탕으로 공개돼 기업 및 개발자 누구나 상업적 용도, 재학습, 축소 모델 개발 등에 제약 없이 활용할 수 있도록 설계됐다. 또한 Hugging Face Transformers, vLLM, llama.cpp, Ollama 등 다양한 추론 프레임워크와 호환돼 기업 환경에 쉽게 통합할 수 있다.

눈에 띄는 점은 Phi-4-Reasoning-Plus가 경쟁 모델 대비 상대적으로 작은 규모임에도 불구하고, 성능 면에서 DeepSeek-R1-Distill-70B 같은 700억 개 파라미터급 모델을 능가했다는 것이다. AIME 2025 수학 시험에서 기준 질문 모두를 처음 시도에서 정답 처리하는 ‘pass@1’ 부문에서 더 높은 정확도를 기록했으며, DeepSeek-R1의 본 모델에도 육박하는 성능을 보였다.

이러한 성과는 마이크로소프트가 데이터 중심적 접근을 통해 모델을 학습시킨 결과로 분석된다. 구성된 학습 데이터에는 구조적 추론을 유도하는 태그 기반의 체계적인 설계가 적용됐으며, 로 표기된 사고 흐름이 모델이 해결 과정을 명확히 인식하고, 일관성 있는 해답을 도출하는 데 중요한 역할을 했다.

여기에 더해 마이크로소프트는 GRPO(Group Relative Policy Optimization) 알고리즘 기반 강화학습을 통해 모델이 단순 정답률뿐 아니라 응답의 간결성, 중복 방지, 형식 일관성까지 확보할 수 있도록 설계했다. 이로 인해 특히 자신이 부족한 문제에서도 더 성찰적인 답변을 생성해내는 능력이 향상됐다.

이 모델은 최대 32,000개 토큰 맥락을 기본 지원하며, 실험적 환경에서는 64,000개까지 확장 가능해 장문 응답이 필요한 AI 어시스턴트형 서비스에 적합하다. 특히 문서 기반 분석, 법률 문서 해석, 재무 모델링 등 텍스트 기반 업무에 강점을 보일 것으로 예상된다.

안전성과 관련해 마이크로소프트는 AI Red Team의 적대적 테스트, Toxigen 기반 민감 콘텐츠 응답 평가 등 다층적 보안 검토를 수행했다. 이는 고위험 환경이나 규제가 요구되는 분야에서 기업이 자체적인 정렬 및 감사 워크플로우를 줄이는 데 도움이 된다.

이번 출시로 마이크로소프트는 고성능 AI 추론 시스템이 반드시 ‘초거대 모델’일 필요는 없다는 메시지를 전하며, 접근성과 활용성이 높은 차세대 AI 전략을 분명히 했다. AI 오케스트레이션, MLOps 운영, 적은 인프라 리소스로 고성능 모델을 원하는 기업 입장에선 주목할 만한 대안이 될 수 있다. 마이크로소프트는 이를 통해 오픈AI나 딥씽크 등과의 성능 격차를 좁히기 위한 기술적 전환점에 돌입한 것으로 보인다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

1

추천

1

스크랩

Scrap

데일리 스탬프

1

매일 스탬프를 찍을 수 있어요!

등급 아이콘

legoboss

00:02

댓글 1

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

legoboss

2025.05.02 00:02:23

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

1