맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

알리바바, 인공지능 모델 Qwen3.5 발표…GPT-5.2 능가

프로필
김민준 기자
댓글 1
좋아요 비화설화 1

알리바바가 GPT-5.2를 능가하는 인공지능 모델 Qwen3.5를 발표했다. 이 모델은 210개 이상의 언어를 지원하고, 하드웨어 효율을 크게 개선했다.

 알리바바, 인공지능 모델 Qwen3.5 발표…GPT-5.2 능가 / TokenPost.ai

알리바바, 인공지능 모델 Qwen3.5 발표…GPT-5.2 능가 / TokenPost.ai

알리바바 그룹이 GPT-5.2와 클로드 4.5 오퍼스를 능가하는 인공지능 모델 Qwen3.5를 발표했다. 이 새로운 알고리즘은 오픈소스 라이선스로 허깅 페이스에 공개되어 있으며, 기본적으로 262,144개의 토큰을 처리할 수 있다. 또한 개발자들은 맞춤화를 통해 이 수치를 거의 네 배까지 늘릴 수 있다. Qwen3.5는 210개 이상의 언어와 방언의 텍스트뿐 아니라 데이터 시각화 같은 이미지를 포함한 프롬프트를 처리할 수 있다.

Qwen3.5는 다양한 작업에 최적화된 여러 신경망으로 구성된 '전문가 혼합 모델'로서, 프롬프트를 받으면 10개의 신경망을 활용해 답변을 생성한다. 이러한 접근 방식은 모든 인공 뉴런을 사용할 필요가 없기 때문에 하드웨어 효율이 높다. 이 모델은 총 3,970억 개의 파라미터를 가지며, 프롬프트 당 170억 개가 사용된다.

모델은 하드웨어 효율을 혁신적으로 개선하기 위해 여러 최적화 기법도 도입했다. 일반적으로 대형 언어 모델의 주의력 메커니즘은 데이터 양에 따라 메모리 필요량이 기하급수적으로 증가하나, Qwen3.5는 메모리 소모를 크게 줄이는 선형 주의 메커니즘을 사용한다. 또한 게이트 델타 네트워크라는 기술을 적용해 LLM이 필요하지 않은 데이터를 메모리에서 제거함으로써 하드웨어 사용을 줄이고, 델타 규칙이라는 학습 알고리즘을 통해 파라미터 업데이트 과정을 최적화한다.

알리바바는 Qwen3.5가 GPT-5.2와 클로드 4.5 오퍼스를 비롯한 다양한 벤치마크에서 우수한 성능을 보였다고 밝혔다. 다중 모드 데이터 처리에도 능하여, 이미지 분석에 특화된 Qwen3-VL 모델을 여러 시각적 추론 및 코딩 벤치마크에서 능가한 것으로 나타났다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

관련된 다른 기사

댓글

댓글

1

추천

1

스크랩

스크랩

데일리 스탬프

1

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

등급

달돌달돌

07:42

댓글 1

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

달돌달돌

2026.02.17 07:42:02

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

1
오늘 하루 열지 않음[닫기] Close

토큰포스트 프리미엄 멤버십, 이 모든 혜택을 무료로 시작하세요

AI신호 + 60강좌 + BBR매거진 + 에어드랍 WL 기회까지!