토픽

맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

크라우드웍스, AI 학습용 영상데이터 구축 핵심 주자 된다

프로필
연합뉴스
댓글 1
좋아요 비화설화 1

크라우드웍스가 방송영상 기반 AI 학습용 데이터 구축 사업의 주요 수행사로 선정돼 고도화된 멀티모달 데이터셋을 제작한다. 이번 사업은 국내 AI 기술 경쟁력 강화와 글로벌 콘텐츠 시장 진출을 위한 기반이 될 전망이다.

 크라우드웍스, AI 학습용 영상데이터 구축 핵심 주자 된다 / 연합뉴스

크라우드웍스, AI 학습용 영상데이터 구축 핵심 주자 된다 / 연합뉴스

국내 인공지능(AI) 기술 기업인 크라우드웍스가 정부가 추진하는 방송영상 기반 AI 학습용 데이터 구축 사업의 일환으로 핵심 역할을 맡게 됐다. 영상 속 장면과 맥락을 정교하게 분석할 수 있는 고도화된 데이터셋을 제작하는 것이 주요 목표다.

이 사업은 과학기술정보통신부와 한국전파진흥협회가 주관하는 국가 데이터 인프라 구축 프로젝트의 일환으로, 방송영상을 통해 학습 가능한 고품질 AI 데이터를 확보하는 데 중점을 둔다. 이에 따라 크라우드웍스는 MBC, iMBC, LG AI연구원, 데이터메이커와 함께 구성된 컨소시엄에 참여해 총 5천 시간 분량의 영상 데이터를 가공하게 된다.

크라우드웍스의 주된 역할은 국내 방송 콘텐츠에 담긴 한국 사회의 문화와 시대상을 반영해, 다중 라벨 구조의 학습 데이터를 만드는 것이다. 다중 라벨링이란 영상에서 객체(사람, 사물), 행동(움직임), 장면(배경, 장소) 등 다양한 요소를 동시에 태그로 분류하는 방식이다. 이를 통해 AI가 단순히 이미지를 인식하는 수준을 뛰어넘어 맥락과 의미까지 해석할 수 있게 하는 것이 목적이다.

이번 프로젝트에서는 특히 영상, 이미지, 자연어(음성 또는 자막을 포함한 언어 정보)를 결합한 '멀티 모달' 데이터셋 구축이 핵심 기술로 꼽힌다. 이는 인간이 영상을 이해할 때처럼 시청각 정보를 함께 고려하게끔 AI를 훈련시키기 위한 방식으로, 장면의 흐름이나 대사의 의미, 등장 인물 간의 관계 등 복합적인 요소의 분석이 가능해진다.

완성된 데이터셋은 향후 AI가 영상 콘텐츠를 자동 요약하거나, 핵심 장면을 추출하고, 상황 맥락에 맞는 설명을 생성하는 데 활용될 전망이다. 일례로 방송 콘텐츠를 기반으로 한 추천 시스템이나 장애인을 위한 화면 해설 기술 등에 응용될 수 있다.

이 같은 흐름은 장기적으로 국내 영상 기반 AI 기술의 경쟁력을 한 단계 끌어올리고, 글로벌 AI 콘텐츠 시장에서도 한국의 입지를 강화하는 데 기여할 수 있을 것으로 보인다. 특히 방송 영상은 문화적 맥락이 강한 학습소재인 만큼, 한국 콘텐츠에 최적화된 AI 개발이 가능해지는 계기가 될 수 있다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

댓글

댓글

1

추천

1

스크랩

스크랩

데일리 스탬프

1

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

등급

사계절

17:26

댓글 1

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

사계절

2025.08.12 17:26:22

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

1