지푸가 시각 프로그래밍을 겨냥한 멀티모달 코딩 기반 모델 'GLM-5V-Turbo'를 공개했다. 이번 모델은 이미지, 영상, 디자인 시안, 문서 레이아웃 등 다양한 입력을 기본적으로 이해하고, 화면 선택, 스크린샷, 웹페이지 읽기 등 멀티모달 도구 호출도 지원한다.
Odaily에 따르면 GLM-5V-Turbo의 컨텍스트 창은 200k까지 확장됐다. 이번 출시는 시각 정보와 개발 작업을 함께 처리하는 AI 코딩 수요에 대응하기 위한 행보다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>