행정안전부가 공공데이터의 인공지능 활용도를 획기적으로 높이기 위한 새로운 기준을 마련한다. 공공기관이 제공하는 데이터를 인공지능이 학습과 분석에 즉시 활용할 수 있도록 가공하는 ‘AI-레디’ 개념을 공식 도입하고, 이를 위한 세부 기준과 데이터 관리 체계를 연내 수립하기로 했다.
그동안 공공데이터는 개방되었음에도 불구하고 실제 활용도는 낮았다. 형식이 제각각이고, 데이터 자체의 품질도 천차만별이었기 때문이다. 예를 들어 같은 주소나 행정 코드가 기관마다 다르게 표기되거나, 갱신 주기와 오류 여부를 알 수 있는 메타정보가 빠져 있어, 인공지능이 데이터를 자동으로 처리하고 분석하기 어려웠다.
이번 ‘AI-레디 공공데이터’ 정책은 이러한 문제를 해결하기 위해 도입된다. 기본적으로 AI가 바로 읽을 수 있는 기계 판독형 형식으로 데이터를 제공하고, 데이터의 완성도(완결성), 결측률(누락된 정보의 비율), 변경 이력, 갱신 주기 등 중요한 관련 정보를 메타데이터에 포함시키는 것이 핵심이다. 메타데이터란 데이터 자체를 설명하는 정보로, 제작일자나 작성자, 파일 구조처럼 데이터를 제대로 활용하기 위해 반드시 필요한 내용을 담고 있다.
또한 주소나 행정 코드처럼 여러 기관에서 공통으로 쓰이는 식별 정보에는 표준화를 적용해 데이터 간 연계성을 높이고, 잘못된 값이나 누락된 정보를 줄일 수 있도록 데이터 품질 기준도 강화될 예정이다. 이를 통해 AI가 정확하고 신뢰성 있는 결과를 도출할 수 있는 기반을 마련하겠다는 게 정부의 의도다.
행정안전부는 민간과 학계를 포함한 전문가 중심의 실무단을 운영해 ‘AI-레디 공공데이터’ 기준을 마련하고, 이를 전국 공공기관에 배포할 계획이다. 우선 데이터 활용도가 높은 자료부터 기준을 적용하고, 공공데이터포털에 이미 개방된 데이터의 수준을 진단해 단계적으로 확대할 방침이다.
이 같은 흐름은 향후 인공지능 산업 전반에 긍정적인 영향을 미칠 가능성이 크다. 공공기관이 양질의 데이터를 선도적으로 제공하게 되면 민간 기업이나 연구기관도 AI 모델 개발과 혁신 서비스 구현에 더욱 박차를 가할 수 있기 때문이다. 정부가 공공데이터 인프라의 질을 높이고자 하는 이번 조치는 단순 행정 효율성 강화를 넘어 디지털 경제 전환을 가속화할 중요한 전환점이 될 수 있다.