버추얼 세포가 생명과학을 바꾼다… CZI, ‘rBio’로 바이오 AI 혁신 선언

| 김민준 기자

찬 주커버그 이니셔티브(CZI)가 개발한 바이오 AI 플랫폼 rBio는 복잡한 실험 없이도 생명현상을 분석할 수 있는 인공지능 모델로, 고가의 실험 장비 대신 가상 세포 시뮬레이션을 활용해 훈련된 것이 특징이다. 이 획기적인 접근법은 생물학적 추론 능력을 갖춘 최초의 모델이라는 점에서 주목을 받고 있으며, 향후 생명과학 분야의 연구 효율성을 획기적으로 끌어올릴 수 있는 기반이 될 전망이다.

기존 생물학 연구는 대부분 실제 실험을 통해 데이터를 축적해왔다. 하지만 rBio는 이 틀을 완전히 뒤집는다. 인간 세포를 컴퓨터 내부에서 가상으로 구현한 '버추얼 셀(Virtual Cell)'을 이용해 다양한 생물학적 시나리오를 시뮬레이션하고, 그 결과를 기반으로 AI를 훈련시킨다는 발상이다. 이 같은 '소프트 검증(soft verification)' 접근법은 실험마다 시간과 비용이 드는 기존 방식의 비효율을 대체할 새로운 표준이 될 수 있다는 평가도 나온다.

앤아 마리아 이스트라테 CZI 선임연구원은 "기존 생물학 연구의 대부분은 실험실에서 진행되고 있으며, 컴퓨터 기반 연구는 여전히 10% 정도에 불과하다"며 "우리는 이 비중을 반대로 전환하고자 한다"고 말했다. 실제로 rBio는 CZI가 수년간 축적해온 가상세포 모델 'TranscriptFormer'로부터 생물학적 메커니즘을 학습했으며, 이를 기반으로 자연어 인터페이스를 도입해 연구자가 일상 언어로 질문을 하면 복잡한 유전자 상호작용 결과를 예측해 응답할 수 있게 설계됐다.

rBio가 주목받는 또 다른 이유는 기존 인공지능이 주로 확정적인 답변을 학습하는 반면, 이 모델은 생명과학 특유의 불확실성과 확률적 추론을 학습 설계에 반영했다는 점이다. 연구진은 정답의 명확성이 떨어지는 생물학 질문에 대해 보상 기준을 확률에 기반해 조절하는 강화학습을 적용, 모델이 불완전한 정보 속에서도 최대한 과학적으로 타당한 예측을 하도록 설계했다.

실제 테스트 결과도 놀라웠다. 바이오 AI 모델의 대표적 평가 기준인 PerturbQA 벤치마크에서 rBio는 실험 기반으로 훈련된 기존 모델들과 비견될 정도의 성능을 보였고, 일부 항목에서는 최신 대형언어모델(LLM)을 완전히 능가하는 결과를 냈다. 특히 완전히 다른 생물학 과제를 풀어야 했던 전이학습 상황에서도 기존 모델에 비해 압도적으로 정확한 해석을 제공해 기술적 완성도를 입증했다.

이번 발표는 CZI 내부적으로도 전환점으로 평가된다. 그동안 사회 정의와 교육 등 광범위한 아젠다를 추구해온 CZI는 최근 과학 연구, 특히 생명과학 중심 조직으로의 집중 전략을 취하고 있으며, rBio는 그 첫 성과이자 상징적인 프로젝트다. CZI는 수년에 걸쳐 다양한 동물과 인간 세포의 전사체 데이터를 구축해 왔으며, 이를 기반으로 고도화된 AI 모델 개발을 준비해왔다. 오픈소스를 기본으로 하는 개발 철학 역시 CZI만의 차별점이다.

이 같은 개방 전략은 소규모 연구소나 스타트업에도 AI 바이오 연구의 문을 열어주는 효과를 낸다. CZI는 rBio를 포함한 모든 시뮬레이션 모델을 자사의 가상세포 플랫폼을 통해 무료로 제공하고 있으며, 누구나 구글 코랩에서 관련 튜토리얼을 실행해 직접 모델을 활용할 수 있게 했다. 이로써 AI 기반 신약개발 시장의 진입 장벽을 낮추고, 더 많은 연구자가 이 기술을 사용할 수 있는 생태계를 조성하는 데 기여하고 있다.

특히 기존의 수십 년이 걸리는 신약 타겟 발굴과 기전 분석이 AI 덕분에 연 단위로 단축될 수 있다는 점에서 rBio는 향후 제약 산업 전체의 구조를 흔들 메가테크가 될 가능성도 지닌다. 알츠하이머 등 복잡한 퇴행성 질환처럼 유전자 간 상호작용이 중요한 분야에서, rBio는 질병 진행 메커니즘을 조기에 이해하고 맞춤형 치료법 개발에 기여할 잠재력을 보이고 있다.

향후 CZI는 이처럼 특정 분야에 국한된 모델을 넘어서 전사체, 단백질체, 세포 이미지 등 다양한 생물학 데이터를 통합하는 '범용 가상세포 AI'로의 확장을 준비 중이다. rBio는 그 첫 단계이자, 이 야심찬 생물학 AI 생태계 구축의 실험 모델로서 중요한 상징적 의미를 갖는다.

이런 혁신이 더욱 중요하게 비치는 이유는 최근 트럼프 행정부의 NIH(미국 국립보건원) 예산 축소 움직임과 맞물려 있기 때문이다. 공공 연구 예산이 위축될 가능성이 있는 상황에서, 민간 차원의 오픈 바이오 AI 인프라 구축은 미국 생명과학 연구의 핵심 동력이자 대안이 될 수 있다. CZI가 주도하는 이 가상세포 기반 연구 플랫폼은 단순한 기술 개발을 넘어, 미래 인류 건강과 과학 발전에 직접적인 기여를 할 수 있는 사회적 엔진으로 성장할 가능성을 보여주고 있다.