오픈AI(OpenAI)가 챗GPT(ChatGPT)에 새로운 안전 기능을 도입한다. 이번 업데이트는 사용자가 정서적으로 극심한 스트레스를 겪고 있을 경우 더 적절한 형태의 대응을 제공할 수 있도록 설계됐다. 인공지능이 단순한 생성형 기능을 넘어서 개인의 정신 건강까지 배려할 수 있는 방향으로 진화하고 있는 셈이다.
우선 이달 중 업데이트 예정인 내용은 GPT-5 시스템의 핵심 요소인 라우터(router) 개선이다. 라우터는 사용자의 입력을 분석해 어떤 언어 모델이 해당 질문에 가장 알맞은지를 실시간으로 판단하고 처리한다. 사용자가 별도로 모델을 지정하지 않더라도, 새로운 라우터는 감정적으로 불안정한 상황 신호를 포착하면 직접 추론 최적화 모델로 전환해 더욱 유익한 응답을 생성하게 된다.
이를테면, 우울감이나 불안을 표현하는 문장이 입력됐을 때, 감정을 더 잘 다룰 수 있는 고급 모델이 자동 선택되어 대응하게 된다. 오픈AI는 해당 기능이 정신적 위기 상황에서 도움이 되는 응답을 유도하는 데 최적화돼 있다고 밝혔다.
또한 부모와 청소년 사용자를 위한 보호장치도 도입된다. 오픈AI는 앞으로 한 달 내 보호자가 자녀 계정과 본인 계정을 연동한 뒤, 기능 일부를 제한하거나 연령에 맞는 AI 이용 규칙을 설정할 수 있도록 할 계획이다. 예를 들어 채팅 기록 공유를 차단하거나, 시스템이 유해할 수 있는 프롬프트를 탐지하면 즉시 알림을 보내는 방식이다.
이러한 기능은 청소년의 사생활 보호와 부모의 감시 사이에서 신뢰를 구축하는 것을 목표로 한다. 오픈AI는 이를 위해 청소년 발달, 정신 건강, 인간-컴퓨터 상호작용 전문가로 구성된 자문위원회를 운영하며, 향후 도입될 모든 안전 기능 개발에 있어 이들의 조언을 적극 반영하겠다고 밝혔다.
여기에는 250명 이상의 의사 및 정신건강 전문가로 구성된 글로벌 의료 네트워크(Global Physician Network)도 포함된다. 이 네트워크는 이미 다양한 연구협력 경험이 있으며, 섭식장애나 중독, 청소년 건강 문제 등 전문 영역을 망라한다. 오픈AI는 향후에도 이 네트워크 확장에 나설 것이라고 강조했다.
이번 발표는 지난달 오픈AI가 공식적으로 밝힌 AI 안전성 강화 전략의 연장선에 있다. 당시 오픈AI는 장시간 대화에서 사용자의 정서적 위기를 조기에 감지하는 능력을 키우고, 해로운 프롬프트 응답을 사전에 차단하는 시스템적 필터링을 강화하겠다고 예고한 바 있다.
오픈AI의 이 같은 접근은 생성형 AI가 실시간 상담 도구로 자리 잡는 시대를 가속화하고 있다. 단순한 정보 제공을 넘어, 인간의 심리적 상태까지 고려한 서비스를 제공하며 기술의 윤리성과 신뢰성을 높이려는 시도로 평가된다.