토픽

맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

오픈AI 오픈모델, 개발자 손에서 탈바꿈… ‘비정렬 GPT’ 등장

프로필
김민준 기자
댓글 0
좋아요 비화설화 0

코넬 박사과정 잭 모리스가 오픈AI의 GPT-OSS 모델을 변형한 'gpt-oss-20b-base'를 공개해 연구자·개발자들의 주목을 받고 있다. 지시 최적화를 제거한 이 모델은 오픈소스 생태계의 창의성과 위험성을 동시에 보여준다.

 오픈AI 오픈모델, 개발자 손에서 탈바꿈… ‘비정렬 GPT’ 등장 / TokenPost.ai

오픈AI 오픈모델, 개발자 손에서 탈바꿈… ‘비정렬 GPT’ 등장 / TokenPost.ai

오픈AI가 지난 8월 공개한 GPT-OSS 시리즈는 자사 최초의 오픈 가중치 모델이라는 점에서 큰 주목을 받았지만, 출시 직후부터 AI 연구자들 사이에서 다양한 해석과 실험이 이어지고 있다. 특히 코넬 테크 박사 과정에 재학 중이며 메타 연구소 연구원으로 활동 중인 잭 모리스는 이를 바탕으로 보다 원초적인 형태의 새 모델 ‘gpt-oss-20b-base’를 공개하며 개발자 커뮤니티 내에서 뜨거운 반응을 끌어냈다.

모리스가 선보인 이 모델은 오픈AI의 GPT-OSS-20B에서 ‘추론 최적화(alignment)’ 기능을 제거한 전(前)지시형 사전훈련 모델이라는 점에서 독특하다. 이는 사전에 학습된 자연어 처리 전반의 능력은 유지하되, 일관된 추론 방식이나 '뒤따르기 좋은 대화 형태'가 아닌 보다 자유롭고 거침없는 응답을 생성하게끔 설계됐다. 정제된 지시 기반 데이터를 반복 학습한 기존 오픈AI 모델과는 달리, 직접적으로 명령을 이해하고 순응하기보다는 단순히 다음 단어를 예측하는 훈련에 집중하는 방식이다.

이런 변화는 모리스가 수년간 연구해온 ‘역정렬(reverse alignment)’ 개념을 실현한 결과다. 그는 GPT-OSS-20B의 일부 MLP 레이어(7, 15, 23번 위치)에 LoRA(Low-Rank Adapter)를 적용해 단 0.3%의 파라미터만 재학습하는 방식으로 구조를 변경했다. 이는 약 2만 개의 FineWeb 문서로 구성된 훈련셋을 이용해 4일간 8개의 NVIDIA H200 GPU에서 진행됐으며, 결과적으로 모델은 오리지널 GPT-OSS와 비교해 훨씬 다양한 표현을 생성할 수 있게 됐다.

이 ‘gpt-oss-20b-base’는 MIT 라이선스로 허깅페이스에 공개되어 누구나 자유롭게 활용할 수 있다. 학계에서는 이를 통해 대형 언어모델이 데이터를 어떻게 기억하고 일반화하는지를 정밀하게 연구할 수 있는 기반이 마련됐다고 평가하며, 학습 필터링이 적용되지 않은 상태에서의 모델 행동 분석에 큰 의미를 부여하고 있다. 하지만 도덕적 검열이 사라졌다는 점에서, 정제되지 않은 발언이나 저작권 문제에 대한 우려도 제기되고 있다.

모리스는 이번 모델을 통해 “단순히 가중치를 복원한 것이 아니라, 원래의 확률 분포(distribution)를 되살려냈다”고 설명했다. 가중치 자체는 원본과 다르지만, 출력값의 확률적 특성이 상당히 유사하다는 뜻이다. 이어 그는 Qwen 등 다른 오픈모델로도 같은 실험을 이어갈 예정이라고 밝히며 확산 가능성을 시사했다.

GPT-OSS의 등장 자체가 오픈AI의 폐쇄 전략에 대한 변화로 해석되는 가운데, 이처럼 외부 개발자가 빠르게 오픈모델을 개조해 독자 모델로 확장하는 사례는 오픈소스 AI 생태계의 역동성을 단적으로 보여준다. 일부는 이러한 접근을 연구자의 자유와 창의성 실현으로 환영하고 있지만, 다른 한편에서는 안전성과 윤리 문제를 둘러싼 새로운 과제가 더욱 부각될 것으로 보인다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1