정부가 인공지능(AI) 기술의 안정성과 신뢰성을 높이기 위해 한국어 특화 평가 데이터 구축에 착수했다. 이는 국내 독자 AI 모델의 국제적 경쟁력을 확보하고, 안전한 AI 활용 환경 조성을 위한 초석으로 풀이된다.
과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 2025년 8월 8일, 인공지능 모델의 위험성과 정확성 등을 검증할 수 있는 데이터셋 개발 사업을 본격 추진한다고 밝혔다. 이번 사업은 정부가 개발 중인 ‘AI 파운데이션 모델(기초 범용 AI 모델)’의 평가 체계 강화를 목적으로 기획되었다. AI 파운데이션 모델이란 언어, 이미지, 데이터 등 여러 분야에서 다양한 과제를 수행할 수 있도록 훈련된 대규모 AI 시스템을 의미한다.
정부가 이처럼 평가기반 구축에 나서게 된 배경에는 최근 급속히 발전하고 있는 AI 기술에 대한 사용자 신뢰 확보 문제가 자리하고 있다. 특히 생성형 AI(텍스트·이미지 등을 스스로 만들어내는 기능)의 확산으로 인해, 오정보 생성, 편향된 판단, 개인정보 유출 등 여러 위험이 우려되면서 이에 대한 객관적 검증 기준 마련이 시급해졌다는 판단이다.
이번 사업을 통해 지능정보사회진흥원은 인공지능안전연구소와 함께 사이버 보안, AI의 자율 판단 능력, 사실 기반의 정답률, 사회적 가치 중립성 등 네 가지 핵심 항목을 중심으로 2만 건 이상의 평가지표 데이터셋을 구축할 계획이다. 이 데이터는 전부 한국어에 특화되어 개발되며, 평가의 정확도와 실효성을 높이는 데 중점을 둔다. 특히 한국어 기반 데이터 확보가 이루어지면 그간 해외 영어 중심으로 한 AI 검사 기준의 한계를 보완할 수 있을 것으로 기대된다.
아울러 정부는 이번 평가지표 시스템을 앞으로 글로벌 수준에 부합하게 발전시켜, 우리 기술로 만든 AI 모델이 해외의 검증 체계와 비교해도 뒤처지지 않도록 한다는 방침이다. 이는 단순히 평가 체계를 구축하는 것을 넘어, 우리나라가 AI 윤리 및 안전의 국제적 기준을 주도할 수 있는 기반을 마련하려는 전략이다.
이 같은 흐름은 향후 국내 AI 산업의 신뢰도와 품질을 높이고, 공공 및 민간 영역에서의 AI 채택 속도를 가속화하는 효과로 이어질 전망이다. 동시에 한국어 특화 AI 모델에 대한 해외 수요 확대에도 긍정적인 영향을 미칠 것으로 보인다.