ETRI-LG, 데이터 컴플라이언스·엑사원 기반 LLM 공동 개발 나선다

| 연합뉴스

한국전자통신연구원(ETRI)과 LG AI연구원이 인공지능 데이터 관리와 대규모 언어모델 개발을 함께 추진하기로 하면서, 공공과 산업 분야 전반에 걸쳐 신뢰 가능한 인공지능 기반 기술 환경 구축이 본격화될 전망이다.

ETRI는 10월 1일, LG AI연구원과 ‘데이터 컴플라이언스 및 대규모 언어모델(LLM) 연구개발’ 협력을 위한 업무협약을 체결했다. 이번 협력은 인공지능 학습에 사용되는 데이터의 적법성과 신뢰성을 강화하기 위한 것으로, 특히 대규모 언어모델이 사회 전반에 빠르게 확산되는 가운데 데이터 기반 기술의 법률적 리스크와 품질 문제를 선제적으로 대응하려는 시도다.

양 기관은 LG AI연구원이 개발한 대규모 언어모델 ‘엑사원(Exaone)’을 기반으로, AI 학습데이터의 출처를 추적하고 법적 위험성을 검증할 수 있는 ‘데이터 컴플라이언스 기술’을 공동 연구할 계획이다. 이를 통해 공공기관이나 기업이 AI를 도입할 때 준수해야 할 데이터 관리 기준을 보다 체계화하는 데 기여할 것으로 기대된다.

아울러, 국방·바이오·에너지 등 전문성이 요구되는 산업 분야를 위한 도메인 특화형 파운데이션 모델 개발도 협력 내용에 포함됐다. 파운데이션 모델은 특정 산업 분야에 적합하게 조정된 AI 모델로, 일반적인 언어모델보다 활용도가 높고 정밀한 분석이 가능하다. 이를 위해 양측은 오픈소스와 최신 AI 기술 성과도 적극 공유하며 새로운 연구과제를 지속적으로 발굴할 예정이라고 밝혔다.

엑사원은 LG AI연구원이 2021년 말 처음 공개한 대형 언어 기반 멀티모달 인공지능 모델로, 텍스트뿐 아니라 이미지 등 다양한 데이터 유형을 함께 처리할 수 있는 것이 특징이다. 특히 엑사원은 올해 7월 최신 버전 4.0을 통해 성능이 대폭 향상됐으며, 지난 8월에는 정부 주도의 ‘국산 AI 파운데이션 모델 개발 사업’의 핵심 연구팀 중 하나로 선정된 바 있다.

이 같은 민관 협력은 국내 AI 기술의 경쟁력을 한층 높이는 핵심 동력으로 작용할 수 있다. 특히 글로벌 기술 규범 정립 움직임이 본격화되는 상황에서, 한국도 신뢰성과 투명성을 강조하는 AI 개발 방향으로 정책과 연구 흐름이 수렴해가는 모습이다. 향후 이 협력이 국내 AI 생태계 전반에 파급력을 미치며, 산업 경쟁력 강화와 기술 자립으로 이어질 가능성이 높다.