미 텍사스대 의과대학(UTMB)이 인공지능(AI)을 기반으로 단순 CT스캔에서도 심장질환 위험환자를 실시간 선별하는 자동화된 시스템을 도입한 이후, 의료 현장의 판도를 바꾸고 있다. 별다른 증상이 없더라도, 비심장 관련 진단을 위해 찍은 CT 이미지 안에서도 AI 알고리즘이 위험군을 간파해내는 시대다. 이렇듯 기존 의료 시스템에서 놓쳤던 부분들을 빠르게 보완하면서 ‘지능 병목(intellectual bottleneck)’이라는 구조적인 한계를 돌파하고 있다는 평가가 나온다.
UTMB는 최근 단순 알고리즘 기반의 이미지 분석 시스템을 활용해 모든 환자의 CT스캔을 심장 위험도 분석 대상으로 자동 등록하고 있다. 해당 스캔이 척추 골절, 폐 질환 등 심장과 무관한 사유로 촬영된 것이라 해도 분석 대상에서 제외되지 않는다. 이 이미지는 곧바로 컨볼루션 신경망(CNN)에 입력돼 관상동맥 석회화 정도를 점수화한 아가트스톤(Agatston) 지표를 도출한다. 일정 기준치 이상일 경우 환자에게 디지털 알림이 전달되며, 심한 경우 주치의는 물론 환자에게도 전화 연락이 따로 이뤄진다.
이 프로그램은 2024년 말부터 가동돼 월 평균 450여 건의 스캔을 평가하고 있으며, 이 중 5~10명 수준이 고위험군으로 분류돼 조기 개입이 진행 중이다. UTMB의 최고 AI 책임자인 피터 맥카프리(Peter McCaffrey)는 “과거엔 심장병이 의심돼야 검사를 진행했지만 이젠 그런 전제조차 필요 없다”고 설명한다.
AI 활용은 심장 질환 분석에 그치지 않는다. 뇌졸중이나 폐색전증 등 신속한 대응이 중요한 응급 사례에도 적용된다. ER에서 환자의 반측 얼굴 마비 등 이상징후가 관찰되면, AI는 해당 CT 이미지에서 혈류 단절이나 혈관 절단 지점을 수 초 내로 탐지해 의료진에게 즉시 공유한다. 이를 통해 수 분의 골든타임 확보가 가능해졌다는 게 UTMB 측 설명이다.
이처럼 빠르고 정확한 검출 능력은 알고리즘의 정밀도와 신뢰성에 기반을 두고 있다. 이를 위해 UTMB는 초기와 지속적 단계 모두에서 민감도 및 특이도, F1 점수 등 지표를 기준으로 모델 성능을 검증하고 있다. 사전 테스트 단계에서는 방사선 전문의의 판독 결과와 AI 결과를 교차 비교하며, 배포 후에도 AI 분석 결과를 무작위로 재평가해 오류와 편향 가능성을 꾸준히 점검한다.
또한, ‘앵커링 바이어스(anchoring bias)’처럼 AI 판단 초기 정보에 과도하게 의존하는 오류를 방지하기 위해 ‘피어 러닝(peer learning)’이라는 방법도 병행한다. 방사선 판독 이미지를 무작위로 익명화해 여러 의사들에게 병행 검토시키고, 그 결과를 비교해 AI 사용 여부가 진단 누락에 영향을 줬는지 분석하는 것이다.
UTMB는 최근 입원 적합성 판단, 심초음파 해석, 임상노트 분석 등 다양한 영역에서도 AI 파일럿 프로그램을 확장하는 중이다. 관련 데이터를 전자건강기록(EHR)에서 추출해 GPT-4o, 클로드, 제미니 등 생성형 AI 모델이 요약 및 평가를 수행하는 구조다. 복잡한 정보 속에서 환자 상태를 빠르게 파악해 적절한 대처 수준을 제시할 수 있도록 돕는다.
맥카프리는 “단순한 사실을 플래그하는 데에도 AI는 큰 역할을 한다”고 강조했다. 그는 “영상, 노트, 검사 결과 등 수많은 데이터가 존재하지만, 지금껏 인간의 역량만으로는 이를 제대로 계산해낼 여력이 없었다”며 “AI 없이는 필요한 수준의 지능과 검토 과정을 시스템 전체에 적용할 수 없기 때문”이라고 설명했다.
이제 AI는 의료의 ‘사후 대응’ 중심에서 ‘조기 식별’과 ‘예방 개입’의 중심축으로 이동하고 있다. UTMB의 사례는 향후 디지털 헬스케어가 나아갈 방향을 명확히 보여주고 있다.