과학 분야에서 인공지능(AI)이 단순한 도구를 넘어 동료 연구자로 자리 잡고 있다. 최근 앨런 인공지능 연구소(AI2)가 선보인 '오토디스커버리(AutoDiscovery)'는 연구 데이터를 스스로 분석하고, 가설을 수립하며, 실험 코드까지 생성·실행하는 획기적인 신경망 기반 AI 시스템으로 주목받고 있다.
오토디스커버리는 AI2의 과학 연구용 생태계 '아스타(Asta)' 플랫폼의 실험적 기능으로 탑재됐다. 해당 플랫폼은 1억 800만 개의 학술 논문 초록과 1,200만 건 이상의 전문 논문에 대한 검색, 요약, 분석 기능을 제공한다. 오토디스커버리는 기존 연구자들이 질문을 던지는 방식에서 한발 나아가, 데이터를 기반으로 AI가 먼저 질문을 제기하는 방식으로 작동한다. 수립된 가설은 자연어로 표현되며, 필요 시 파이썬(Python) 코드를 생성해 실험을 수행하고 통계 결과를 해석함으로써 새로운 탐구 방향까지 제안한다.
AI2에 따르면 오토디스커버리는 단시간 내 간단한 분석뿐 아니라, 수백 편 이상의 논문 데이터를 바탕으로 심층 탐구도 가능하다. 결과는 모두 재현 가능한 형태로 제공돼 추가 분석에도 유리하다. 특히 해당 기술은 암 치료 연구와 같은 복잡하고 민감한 분야에서 숨은 발견을 이끌어낼 수 있다는 점에서 기대를 모으고 있다. 이를 뒷받침하듯 스웨디시 암 연구소(Swedish Cancer Institute)의 면역암센터 소장을 맡고 있는 켈리 폴슨 박사는 “오토디스커버리는 겉으로 드러나지 않은 중요한 연결성을 밝혀내는 데 실질적 도움을 줄 수 있다”고 밝혔다.
핵심 알고리즘은 베이지안 서프라이즈(Bayesian Surprise)와 몬테카를로 트리 탐색(MCTS)이다. 전자는 기존 지식 기반의 신념과 새로운 증거 간의 차이를 정량화함으로써 '얼마나 놀랄 만한 발견인지'를 판단하고, 후자는 기존 탐색 경로와 새로운 가능성을 균형 있게 검토하게 해준다. 예기치 못했던 결과 또한 분석 출발점이 되는 셈이다. 실제로 19세기 후반 ‘악취(miasma)’가 질병의 원인이라는 믿음이 ‘세균 이론(germ theory)’으로 전환됐던 사례처럼, 예상 밖의 결론이 기존 과학 패러다임을 뒤흔들 수 있다는 점에 오토디스커버리는 주목한다.
스크립스 해양연구소(Scripps Institution of Oceanography)의 파비오 파보레토 박사는 “AI가 수많은 가설을 생성하고, 연구자가 직접 이를 평가할 수 있게 돕는 구조는 과학적 판단의 깊이를 확장시킨다”고 평가했다. AI2는 이번 시스템이 과학자와 데이터 간의 관계를 정적으로 유지되는 정보 저장소에서 능동적 파트너로 변화시켰다고 강조했다.
현재 오토디스커버리는 AI2의 아스타 플랫폼에서 실험적인 형태로 제공되고 있으며, 향후 개발이 진전되면 더 넓은 연구 영역으로 확대될 가능성이 높다. AI를 통한 자율적 지식 탐색이라는 개념이 본격화되며, 향후 과학의 패러다임 자체가 AI 중심으로 재편될 수 있다는 전망도 점차 현실화되고 있다.




