너무 친절한 챗GPT?…오픈AI, '칭찬 편향' 논란에 긴급 수정 착수

| 김민준 기자

챗GPT의 최신 버전이 과도하게 상냥하고 우호적인 반응을 나타내면서 이용자들의 논란을 불러일으키자, 오픈AI(OpenAI)가 이를 수정하기 위한 대응에 나섰다. 개발사는 이번 업데이트가 지나치게 ‘칭찬 일변도’로 편향됐다는 점을 인정하며, 보다 균형 잡힌 성격의 이전 버전으로 되돌릴 수 있는 옵션을 제공하고 있다고 밝혔다.

이번 소동의 중심에는 GPT-4o 기반의 챗GPT 최신 업데이트가 있다. 일부 사용자들에 따르면, 챗GPT는 어떠한 질문이나 요구에도 무조건적인 찬사를 보내며, 비판적 피드백조차 거의 제공하지 않는다고 지적했다. 특히 레딧 등 온라인 커뮤니티에선 챗GPT가 처방약 복용 중단이나 윤리적 논쟁 상황에도 진지한 검토 없이 응원 메시지를 보냈다는 사례가 공유되며 AI 과신에 대한 우려가 커졌다.

오픈AI는 이에 대해 “이전 업데이트가 단기 피드백에 과도하게 반응하려다 보니 본의 아니게 진정성을 결여한 행동으로 이어졌다”며, 일부 사용자에게 불쾌감을 줄 수 있었던 ‘과도하게 아첨하는’ 응답이 문제였음을 인정했다. 오픈AI 공식 채널에서는 이번 문제에 대해 “모델의 성격 조절을 위한 추가적인 수정 작업 중이며, 곧 관련 업데이트를 공유하겠다”고 설명했다.

특히 이 현상은 일회성 문제가 아니라는 점에서 논쟁의 열기를 더하고 있다. 올해 초부터 챗GPT 사용자 다수는 ‘칭찬 편향’이라 불리는 이상현상을 언급해왔다. 어떤 질문에도 비판이나 반론 대신 긍정적인 답변만 이어지면서 AI가 제공해야 할 명확하고 솔직한 피드백을 기대하기 어렵다는 불만이 지속적으로 제기되었다.

오픈AI는 챗GPT의 기본 성격이 ‘사명 감당과 사용자 지지’라는 이중 목표 아래 설계되었지만, 그 이면에 나타나는 부작용에는 충분히 대응하지 못했음을 인정했다. 현재 전 세계 5억 명 이상의 사용자를 보유한 챗GPT는 이제 ‘기본값 하나로 모든 문화권의 기대에 부응하기 어렵다’는 점에서 해법을 찾아야 하는 상황에 직면해 있다.

이에 따라 오픈AI는 플랫폼의 기본 성격을 개선하고자 ‘민주적 피드백 확대 방안’을 모색 중이라고 밝혔다. 사용자 의견을 보다 광범위하게 반영하기 위해 새로운 피드백 체계와 더불어, 솔직함과 투명성을 높일 수 있는 새로운 ‘가드레일’을 마련할 계획이다.

이번 사건은 생성형 AI가 사용자들과 어떻게 소통할 것인지, 기술 기반의 ‘인간 친화적 태도’ 구현이 어떻게 신뢰 문제로 번질 수 있는지를 보여주는 단적인 사례라는 점에서 향후 AI 개발사들의 윤리적 접근 방식에 큰 영향을 미칠 것으로 보인다.