국내 인공지능(AI) 기술 기업인 크라우드웍스가 정부가 추진하는 방송영상 기반 AI 학습용 데이터 구축 사업의 일환으로 핵심 역할을 맡게 됐다. 영상 속 장면과 맥락을 정교하게 분석할 수 있는 고도화된 데이터셋을 제작하는 것이 주요 목표다.
이 사업은 과학기술정보통신부와 한국전파진흥협회가 주관하는 국가 데이터 인프라 구축 프로젝트의 일환으로, 방송영상을 통해 학습 가능한 고품질 AI 데이터를 확보하는 데 중점을 둔다. 이에 따라 크라우드웍스는 MBC, iMBC, LG AI연구원, 데이터메이커와 함께 구성된 컨소시엄에 참여해 총 5천 시간 분량의 영상 데이터를 가공하게 된다.
크라우드웍스의 주된 역할은 국내 방송 콘텐츠에 담긴 한국 사회의 문화와 시대상을 반영해, 다중 라벨 구조의 학습 데이터를 만드는 것이다. 다중 라벨링이란 영상에서 객체(사람, 사물), 행동(움직임), 장면(배경, 장소) 등 다양한 요소를 동시에 태그로 분류하는 방식이다. 이를 통해 AI가 단순히 이미지를 인식하는 수준을 뛰어넘어 맥락과 의미까지 해석할 수 있게 하는 것이 목적이다.
이번 프로젝트에서는 특히 영상, 이미지, 자연어(음성 또는 자막을 포함한 언어 정보)를 결합한 '멀티 모달' 데이터셋 구축이 핵심 기술로 꼽힌다. 이는 인간이 영상을 이해할 때처럼 시청각 정보를 함께 고려하게끔 AI를 훈련시키기 위한 방식으로, 장면의 흐름이나 대사의 의미, 등장 인물 간의 관계 등 복합적인 요소의 분석이 가능해진다.
완성된 데이터셋은 향후 AI가 영상 콘텐츠를 자동 요약하거나, 핵심 장면을 추출하고, 상황 맥락에 맞는 설명을 생성하는 데 활용될 전망이다. 일례로 방송 콘텐츠를 기반으로 한 추천 시스템이나 장애인을 위한 화면 해설 기술 등에 응용될 수 있다.
이 같은 흐름은 장기적으로 국내 영상 기반 AI 기술의 경쟁력을 한 단계 끌어올리고, 글로벌 AI 콘텐츠 시장에서도 한국의 입지를 강화하는 데 기여할 수 있을 것으로 보인다. 특히 방송 영상은 문화적 맥락이 강한 학습소재인 만큼, 한국 콘텐츠에 최적화된 AI 개발이 가능해지는 계기가 될 수 있다.