맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

UCSC, 초경량 AI 비전 모델 ‘오픈비전’ 전격 공개… CLIP·SigLIP 뛰어넘다

작성자 이미지
김민준 기자
0
0

UCSC가 오픈소스 멀티모달 비전 인코더 ‘오픈비전’을 공개하며 CLIP과 SigLIP을 능가하는 성능을 입증했다. 학습 비용 절감과 범용성으로 기업 현장 적용성도 강조됐다.

UCSC, 초경량 AI 비전 모델 ‘오픈비전’ 전격 공개… CLIP·SigLIP 뛰어넘다 / TokenPost Ai

미국 캘리포니아대학교 산타크루즈 캠퍼스(UCSC)가 이미지 처리용 비전 인코더 신모델 ‘오픈비전(OpenVision)’을 공개하며, 오픈AI(OpenAI)의 CLIP, 구글(GOOGL)의 SigLIP을 넘는 성능을 내세워 주목을 받고 있다. 오픈소스로 제공되는 이 모델은 뛰어난 멀티모달 처리 능력과 경량화 설계로 기업 현장에서도 즉시 활용할 수 있는 범용성을 강조한다.

오픈비전은 시청각 정보를 수치 데이터로 변환해 다른 인공지능 모델이 이해할 수 있도록 돕는 ‘비전 인코더’로 구성돼 있으며, 이미지 분류와 검색, 멀티모달 추론 등 다양한 작업에서 기존 모델보다 우수한 성능을 나타냈다. 특히 LLaVA 기반 벤치마크 시험에서 오픈AI의 CLIP과 구글 SigLIP 모델을 능가하는 결과를 다수 기록했다.

주목할 점은 오픈비전이 26가지 버전으로 출시됐고, 가장 작은 모델은 590만 개의 파라미터만 사용해도 고정밀 시각 처리를 수행할 수 있어 엣지 컴퓨팅 환경이나 범용 단말기에서도 운용이 가능하다는 것이다. 큰 모델은 최대 6억 3,210만 개의 파라미터를 탑재해 고해상도 서버 작업에 적합하다. Apache 2.0 라이선스를 적용해 기업용 상업적 활용도 자유롭다.

프로젝트는 UCSC의 시항 시에(Cihang Xie) 교수 주도로 개발됐으며, CLIP의 학습 구조와 텍스트 생성 모델 LLaVA를 결합한 ‘리캡-데이터컴프-1B’ 데이터셋을 기반으로 학습됐다. 여기에 레졸루션을 점진적으로 높이는 방식의 ‘프로그레시브 훈련 전략’을 도입해 기존 모델 대비 학습 비용을 2~3배 줄이는 효과도 입증됐다.

작지만 강한 AI를 지향하는 오픈비전의 경쟁력은 더 작고 효율적인 언어 모델과의 결합에서도 드러난다. 1억 5,000만 개 파라미터 크기의 소형 언어 모델(Smol-LM)과 함께 멀티모달 AI 시스템으로 구성한 실험에서, 총 모델 규모가 2억 5,000만 개 파라미터에 불과했음에도 문서 이해, 시각 질문 응답 등 각종 과제를 안정적으로 해냈다. 이는 스마트폰, 카메라 센서, 공장 현장 등 리소스 제약이 있는 환경에서도 활용 가능하다는 점에서 의미가 크다.

기업 관점에서도 오픈비전은 전략적 가치를 제공한다. 언어모델 개발자에게는 신뢰할 수 있는 시각 처리 기술을 자체 시스템에 쉽게 통합할 수 있는 수단이며, 오케스트레이션 영역에선 폼팩터별로 탄력적인 모델 선택이 가능해 비용절감 효과를 기대할 수 있다. 또한 폐쇄형 외부 API 대신 커스터마이징 가능한 오픈 구조를 채택해 보안과 컴플라이언스를 강화할 수 있다는 점도 차별점이다.

오픈비전은 파이토치(PyTorch)와 JAX 버전으로 모두 제공되며, 허깅페이스(Hugging Face)를 통해 모델과 학습 레시피도 무료로 배포된다. 프로젝트 페이지와 깃허브(GitHub) 저장소를 통해 완전한 재현도 가능하도록 설계됐다는 점에서, 개방성과 실용성 두 가지 측면에서 시장의 기대를 받고 있다.

기업이 독립적이고 효율적인 멀티모달 AI 기반 서비스를 구축하려는 흐름 속에서 오픈비전은 핵심 기능만 모듈화한 접근법으로 벤더 종속 문제를 해소하며, 조직 내부 데이터 보안과 작업 최적화를 동시에 잡을 수 있는 유연한 솔루션으로 부상하고 있다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

0

추천

0

스크랩

Scrap

데일리 스탬프

0

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1