생성형 인공지능의 급속한 확산에 따라 학습 데이터를 둘러싼 활용과 저작권 보호 간의 갈등이 심화되는 가운데, 정부와 국회가 관련 제도의 정비에 본격적으로 나설 필요성이 제기됐다.
국회 입법조사처는 11월 13일 발표한 'AI 데이터 학습과 저작권 문제 해결을 위한 과제' 보고서를 통해, 인공지능 기술이 발전하면서 AI 모델 학습에 필요한 대규모 데이터가 저작권법상 보호 대상인 창작물과 본질적인 충돌을 일으키고 있다고 지적했다. 이에 따라 데이터 사용의 대가 산정, 소유권 분배, 이용 과정의 투명성을 제도적으로 뒷받침해야 한다는 제언을 내놨다.
현행법상 한국은 미국식의 '공정이용' 원칙을 기반으로 하고 있다. 이는 목적, 활용 방식, 시장에 미치는 영향 등이 종합적으로 고려돼 판단되는 시스템이다. 그러나 실제 판례가 충분하지 않아 법적 예측 가능성이 낮고, 그 불확실성은 산업계 전반에 부담으로 작용하고 있다는 평가가 나온다. 특히 스타트업이나 중소기업은 대형 기업처럼 개별 저작물마다 계약을 체결해 대응하기 어려운 만큼, 실질적 접근성이 떨어진다는 문제가 있다.
국제적인 대응 사례를 보면, 유럽연합(EU), 영국, 일본 등은 '텍스트·데이터 마이닝(TDM)' 면책 조항을 채택해 일부 범위 안에서 저작권자의 동의 없이 데이터를 학습에 활용할 수 있도록 하고 있다. 유럽연합은 비영리 학술용에는 폭넓은 예외를 허용하면서도, 상업적 이용 시에는 저작권자의 권한을 존중하는 이중적인 접근 원칙을 적용하고 있다. 반면 미국은 사례에 따라 개별 판단을 내리는 전통적인 공정이용 방식에 머무르고 있다.
보고서는 저작권자는 AI 학습으로 인해 시장 수익이 잠식되고 창작자의 권익이 침해될 가능성을 우려하는 반면, 산업계는 법적 불확실성과 규제 환경으로 인해 기술 개발이 지체될 수 있다는 입장을 보이고 있는 만큼, 이 양측의 시각차를 해소할 수 있는 중립적인 기준 마련이 필요하다고 강조했다. 특히, 표준 계약서나 분쟁조정 절차와 같은 제도 장치를 통해 협상력이 약한 저작권자도 공정한 대가를 받을 수 있도록 틀을 마련해야 한다고 제안했다.
이 같은 흐름은 향후 AI 학습에 필요한 데이터 활용의 제도화를 더욱 앞당길 가능성이 크다. 특히 초거대 언어모델(LLM) 등 기술 개발 속도가 빠른 만큼, 한국도 국제 기준에 뒤처지지 않도록 TDM 면책 규정 도입 검토와 학습데이터 투명성 확보를 위한 법률적 기반 마련을 탄력 있게 추진해야 할 것으로 보인다.




