바이트댄스가 또 한 번 AI 업계를 뒤흔들고 있다. 최근 틱톡이 백악관의 공식 계정 개설로 주목받는 가운데, 모회사 바이트댄스는 새로운 초거대 오픈소스 언어모델 시리즈 ‘Seed-OSS-36B’를 공개하며 기술적 존재감을 과시했다.
Seed-OSS-36B는 고도화된 추론 기능과 개발자 중심의 유연성을 갖춘 대규모 언어모델(LLM)로, 입력 및 출력 시 처리 가능한 문맥량이 무려 51만 2,000토큰에 달한다. 이는 대표적인 경쟁 LLM인 오픈AI(OpenAI), 앤스로픽(Anthropic) 등의 모델을 넘어서는 수준으로, 바이트댄스는 효율성과 확장성 부문에서 주도권을 확보하겠다는 포부를 드러냈다.
공개된 Seed-OSS-36B 시리즈는 총 세 가지로, 합성 데이터 적용 여부에 따라 ‘Base(합성 포함)’, ‘Base(비합성)’, 교육 목적에 최적화된 ‘Instruct’ 버전이 존재한다. 합성 데이터 버전은 벤치마크에서 전반적으로 높은 정확도를 보이며 범용 활용성 측면에서 강점을 가지는 반면, 비합성 모델은 훈련 후 연구 및 편향 제거를 목적으로 한 순수 모델로 평가된다. Instruct는 직접적 지시 수행에 최적화된 후속 학습 모델로, 특정 응답 과제를 잘 수행하도록 설계됐다.
이들 모델은 아파치 2.0(Apache-2.0) 라이선스로 배포돼 기업들이 상업적 용도로 자유롭게 활용하거나 수정할 수 있다. API 비용이나 사용료 부담이 없기 때문에 엔터프라이즈의 비용 효율성 측면에서 매우 매력적으로 작용한다.
Seed-OSS-36B의 가장 큰 특장점은 처리 가능한 맥락 길이, 즉 ‘512K 토큰’이다. 이는 기존 GPT-5 수준의 모델들이 제공하는 맥락 폭의 두 배에 이르며, 약 1,600페이지 분량의 글을 손실 없이 처리할 수 있는 성능을 의미한다. 이러한 장점은 긴 문서 처리나 복잡한 추론이 필요한 작업에 있어 혁신적인 진입점을 제공한다.
또한 독특한 기능 중 하나인 ‘사고예산(thinking budget)’ 설정은 사용자가 모델이 응답 전 수행해야 할 추론의 양을 직접 조절할 수 있도록 한다. 이는 작업 난이도에 따라 자원 사용량과 출력을 동적으로 최적화할 수 있도록 돕는다. 엔비디아(NVDA)의 최신 오픈모델 ‘네모트론 나노(Nemotron-Nano-9B-v2)’에서 도입한 유사 기능과 궤를 같이하며, 확장 가능성과 실용성을 모두 고려한 설계다.
성능 지표에서도 Seed-OSS-36B는 주목할 만한 결과를 나타냈다. 수학 및 논리 추론에서 Instruct 모델은 AIME24 기준 91.7%, 고난도 벤치마크 BeyondAIME에서 65점을 기록하며 오픈소스 부문 최고 성능을 입증했다. 라이브코딩 벤치마크 LiveCodeBench v6에서는 67.4점으로 코드 생성 분야에서도 강한 면모를 보였고, 12만8,000토큰 맥락 처리 테스트인 RULER에서는 94.6점을 획득하며 현존 최고 기록을 경신했다.
Seed-OSS의 또 다른 강점은 누구나 쉽게 접근 가능한 배포 환경이다. 허깅페이스(Hugging Face)를 기반으로 제공되며, vLLM과의 호환, 4비트 및 8비트 양자화 지원을 포함해 소규모 팀도 대용량 모델을 실험할 수 있도록 배려됐다. 여기에 추론 스크립트, 프롬프트 수정 도구, API 서버 설정 예시까지 포함돼 현업 적용 장벽이 현저히 낮다.
바이트댄스 AI 연구팀인 Seed Team은 2023년 출범 이래 기초연구와 실전 활용을 모두 겨냥한 모델 개발에 집중해왔으며, 이번 릴리스를 통해 글로벌 AI 생태계에서 오픈소스 모델의 진화를 다시금 앞당기고 있다. 특히 최근 오픈AI가 GPT-OSS 시리즈를 내놓으며 오픈소스 영역에서 추격을 시도하고 있는 상황에서, 바이트댄스의 이번 행보는 기술 리더십을 재확인하는 계기가 됐다.
기업 의사결정자들이 검토할 핵심 포인트는 세 가지다. 하나는 수학, 코딩, 장문 맥락 처리 등 벤치마크에서 최고 수준의 성과다. 둘째는 고성능 모델과 깨끗한 연구용 모델 간의 균형적 구성이다. 마지막으로 엔지니어링 리소스를 최소화할 수 있도록 구성된 친화적 배포 환경이다.
바이트댄스는 이번 Seed-OSS-36B 출시를 통해, AI 성능과 오픈소스 가치를 모두 잡으려는 의지를 명확히 했다. 오픈모델의 다음 스텝을 고민 중인 기업들과 연구자들에게 중요한 선택지로 부상할 가능성이 크다.