대형언어모델(LLM)의 활용 범위가 빠르게 넓어지고 있지만, 위성 이미지나 지진 탐사 자료처럼 ‘복잡한 비정형 데이터’를 해석하는 데는 여전히 한계가 뚜렷하다. 미국 댈러스 기반 스타트업 리움(Lium)은 이런 문제를 해결하기 위한 ‘에이전틱 하니스’를 출시했다고 밝혔다.
리움은 이번 제품 공개와 함께 550만달러, 원화 약 83억4000만원의 시드 투자를 유치했다고 발표했다. 투자에는 SJF 벤처스, 웨이브메이커 360, 리치 캐피털, GC&H 인베스트먼트가 참여했다. 리움은 이전에 ‘아스트로마인드’라는 이름으로 알려졌던 회사다.
이 회사가 겨냥한 지점은 명확하다. 현재 LLM은 텍스트와 코드 처리에는 강점을 보이지만, 위성 영상, 전자기 스펙트럼 분석, 지진 조사 자료 같은 과학·산업 데이터에서는 성능이 급격히 떨어진다. 그 결과 연구자와 엔지니어가 직접 데이터를 손질하고 정리해 AI가 읽을 수 있는 형태로 바꿔야 하는 번거로운 작업이 반복돼 왔다.
리움은 이 문제를 ‘데이터 가독성’의 한계로 보고 있다. 자사 플랫폼은 복잡한 원시 데이터를 LLM이 이해할 수 있는 구조로 재정렬해 주는 일종의 연결 계층 역할을 한다. 과학자들은 이를 통해 원시 텔레메트리 데이터를 바탕으로 질문하고, 더 일관된 답변을 받을 수 있다는 설명이다.
공동창업자이자 최고경영자 조시 너트슨(Josh Knutson)은 “에너지, 과학, 인프라 분야의 핵심 데이터는 여전히 AI가 추론하기 어렵다”며 “리움은 복잡한 데이터를 실제 지식으로 바꾸는 데 초점을 맞춘 도구”라고 말했다.
리움의 핵심 방식은 데이터 유형마다 맞춤형 AI 에이전트를 만드는 것이다. 새로운 데이터 형식이 들어오면 이를 해석할 전용 에이전트를 생성하고, 이 에이전트가 원시 정보를 LLM이 읽을 수 있는 형태로 구조화한다. 회사는 이 과정을 거친 데이터에 질의하면 더 일관되고 재현 가능한 결과를 얻을 수 있다고 강조했다.
이 같은 접근은 LLM의 대표적 약점인 ‘환각’을 줄이는 데도 의미가 있다. 특히 숫자 구조가 복잡하거나 맥락이 불명확한 자료를 다룰 때 모델이 사실과 다른 답을 내놓는 경우가 많은데, 리움은 에이전트가 사용 과정에서 서식 변환 방식을 계속 다듬으며 검색성과 정확도를 높인다고 설명했다.
실제 적용 사례도 공개했다. 리움은 천체물리학자들과 협력해 해석이 까다로운 희소 X선 데이터를 분석해 왔고, 일부 사례에서는 외계행성의 대기 성분 분석을 지원해 ‘지구 밖 생명체’ 탐색 가능성까지 넓혔다고 밝혔다.
지상 분야 적용도 진행 중이다. 리움은 노스캐롤라이나 기후연구소와 함께 테라바이트급 위성 이미지와 기상관측소 데이터를 처리하고 있으며, 산업용 발전기 서비스 기업 넥스젠은 전자기 스펙트럼 분석 자동화에 이 기술을 활용하고 있다. 회사 측은 기존의 수작업 중심 점검 과정을 일관된 발전기 상태 보고서 생산 체계로 바꿨다고 설명했다.
공동창업자 라이언 틸(Ryan Thill)은 “세상에서 가장 중요한 데이터 상당수는 지금까지 LLM에 사실상 접근 불가능했다”며 “이를 읽을 수 있게 만들면 과학자부터 기업 경영진까지 더 다양한 AI 활용 사례가 열릴 수 있다”고 말했다.
이번 리움의 행보는 생성형 AI 경쟁이 ‘모델 성능’에서 ‘데이터 활용성’으로 확장되고 있음을 보여준다. 결국 AI의 실질적 가치는 더 많은 데이터를 얼마나 정확하게 읽고 해석하느냐에 달려 있다는 점에서, 복잡한 과학 데이터 처리 기술은 향후 산업 AI 시장의 중요한 변수로 떠오를 가능성이 있다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
많이 본 기사