AWS가 규제 산업에서의 인공지능(AI) 도입 확대를 위해 한층 더 강화된 신뢰성 검증 기술을 내놓았다. 자동추론검사(Automated Reasoning Checks)를 클라우드 플랫폼 베드락(Bedrock)을 통해 정식 출시하며, 수학적 근거를 기반으로 AI 응답의 정합성을 검토하는 방식이다. 이를 통해 생성형 AI에서 흔히 발생하는 '환각(hallucination)' 문제를 거의 완전히 제거할 수 있다는 자신감을 내비쳤다.
이번 기능은 단순한 감시 도구를 넘어서, AI가 재무나 법률 등 규제를 받는 분야에 투입될 수 있는 근거 있는 지능을 갖추도록 지원하는 것이 핵심이다. AWS의 자동추론그룹 부사장 바이런 쿡(Byron Cook)에 따르면, 올해 초 일부 기업 고객을 대상으로 진행된 시범 운영을 통해 해당 기술의 신뢰성과 실효성이 입증됐다. 그는 “AI 모델의 응답이 사실인지 또는 잘못된 것인지 확인할 수 있다는 점에서 기업들의 반응은 매우 고무적이었다”고 밝혔다.
자동추론검사는 질문에 대한 모델의 대답이 정책 또는 규칙 기반 현실(ground truth)에 부합하는지 수학적으로 입증한다. 기존의 결과 기반 검사가 아닌 정리(proof) 기반 접근 방식을 택해 ‘참인지 아닌지’를 분명히 구분할 수 있다. 이런 점에서 기계적 오류가 가져올 오해나 법적 위험을 줄이고자 하는 금융, 의료, 정부 등 규제 산업에 적합하다.
특히 베드락을 통해 사용할 수 있는 현재 버전에서는 최대 80K 토큰 또는 100페이지 분량의 문서를 처리할 수 있으며, 반복 실행이 가능한 정책 검증 테스트 저장, 자연어 피드백 추천 기능, 사용자 맞춤형 검증 설정 등 다양한 기능이 추가됐다.
AWS가 주목하고 있는 신경기호 AI(Neurosymbolic AI) 접근은 생성형 AI의 패턴 인식 능력과 논리 기반 판단을 융합한 것이다. 기존의 신경망 기반 대형 언어모델이 가지는 불확실성과 모호함을 줄이기 위해, 수학적 추론 도구를 결합해 보다 신뢰 가능한 응답을 만들고자 한다는 취지다. 이 같은 기술적 흐름은 최근 인공지능 분야의 저명 인사인 개리 마커스(Gary Marcus) 등이 강조하고 있는 인공지능 일반화(AGI)의 핵심 기반으로도 자리잡고 있다.
쿡은 “기호 기반 논리에 익숙한 사람들일수록 이 도구의 유용성을 더 빠르게 받아들이고 있다”며, “실제로 내부 테스트 중 몇 차례 논쟁 끝에 모델의 응답이 규칙에 부합함을 해당 도구가 입증해낸 상황도 있었다”고 소개했다.
한편, AWS는 이번 도구가 에이전트 기반 AI 운영에도 적합하다는 점을 강조하며, 향후 더 많은 베드락 사용자에게 기능을 개방할 계획이다. 다만 쿡은 “신경기호 AI는 아직 초기 단계이며, 고객의 실험과 학습 과정이 반드시 필요하다”고 덧붙였다.
현재 제품화된 신경기호 AI 솔루션을 제공하는 기업은 많지 않지만, 코그니토스(Kognitos), 프란츠(Franz Inc), UMNAI 등의 업체들이 이 시장에서 활발히 개발을 이어가고 있다. AWS는 이들과의 경쟁에서 수학 기반 신뢰성 검증이라는 차별화된 기술을 무기로 규제 산업을 공략하고 있다. 이로써 고객은 고비용 추론과 에너지 사용 부담 속에서도 신뢰 가능한 AI 시스템을 구축할 수 있는 실질적인 해답을 얻게 됐다.