오픈AI(OpenAI)가 자사 AI 챗봇 '챗GPT'에 획기적인 기능을 추가하며 다시 한 번 이목을 끌고 있다. 새롭게 공개된 '챗GPT 에이전트'(ChatGPT Agent)는 사용자가 웹과 앱 환경에서 수행해야 했던 복잡한 태스크를 대신 해내는 가상 컴퓨터 역할을 하며, 챗GPT가 단순 질문응답을 넘어 실질적인 업무 수행자로 도약하고 있음을 보여준다.
이번 기능은 챗GPT에 자체 가상PC 환경을 부여함으로써, 사용자의 이메일, 깃허브(GitHub) 등 다양한 온라인 계정에 직접 접속하고, 파일을 내려받고 생성하는 등의 복합적인 작업을 수행하게 한다. 예컨대 사용자가 간단히 “경쟁사 분석 보고서 만들어줘”라고 지시하면, 에이전트는 브라우저로 관련 정보를 수집하고, 코드 실행과 문서 작성, 시각화 작업까지 마친 후 보고서를 생성해 제공할 수 있게 된다.
챗GPT 에이전트는 두 가지 기존 기능, 즉 웹을 통해 각종 양식을 입력하던 '오퍼레이터'(Operator)와 심층 데이터 리서치를 수행하던 '딥 리서치'(Deep Research)를 하나로 통합해 개발됐다. 이에 따라 웹 기반 앱은 물론, 엑셀, 슬라이드 작성 도구 같은 로컬 환경까지 넘나드는 폭넓은 커버리지를 확보하게 됐다. 사용자 인증이 필요한 페이지에서도 암호화된 로그인 창을 거쳐 작업을 수행할 수 있어 개인화된 업무 지원 수준도 한층 강화됐다.
작업 흐름도 자연스럽다. 하나의 세션 내에서 코드 실행, 웹 탐색, 문서 편집 등 다양한 툴을 넘나들며 업무를 수행하며, 사용자가 언제든 작업을 멈추거나 전략을 변경할 수 있는 유연성도 갖췄다. 현재 월 200달러(약 28만 8,000원) 요금제인 '프로(Pro)' 이용자에게는 월 400회까지 기능이 제공되며, 차등 요금제에도 순차 적용될 예정이다.
오픈AI는 이번 기능이 사용자 안전과 통제 권한을 최우선으로 고려해 설계됐다고 강조했다. 실제 이메일 전송이나 양식 제출 전에는 사용자 확인이 필수이며, 민감한 작업은 ‘감시 모드’에서 진행되거나 자동 차단된다. 기억 기능은 에이전트 세션 내에서 일시적으로만 작동해 개인 정보 보안도 강화됐다.
나아가 오픈AI는 이 기능을 생물학∙화학 분야에서 고위험 역량 시스템으로 정의하고 있다. 이는 윤리적 오용 가능성에 선제적으로 대비하려는 조치로, 전문가 그룹의 레드팀 분석과 고도의 거부 반응 훈련이 포함된다. 앤트로픽(Anthropic)의 클로드4 오퍼스가 정부기관에 사용자 정보를 통보했단 논란처럼, 에이전트 AI가 자율적으로 ‘도덕적 옳음’을 실행할 경우 발생할 수 있는 책임 문제를 의식한 것으로 보인다.
기능 성능 면에서도 인상적인 성과를 보이고 있다. 챗GPT 에이전트는 인간의 도메인 지식과 추론 능력을 테스트하는 '인류최후시험(Humanity’s Last Exam)'에서 역대 최고점인 44.4점을 기록했으며, 수학 문제 해결 전문 벤치마크인 '프론티어매쓰'에서도 27.4%의 정확도를 달성했다. 엑셀 사용 능력을 평가하는 '스프레드시트벤치'에서도 기존 코파일럿(Copilot)의 두 배인 45.5% 점수를 받았다.
다만 일부 슬라이드 생성 기능은 아직 베타 단계로, 출력물과 미리보기 형식 사이에 미세한 차이가 존재한다. 하지만 오픈AI가 향후 이 기능을 고도화할 계획이라고 밝혀, 실제 프레젠테이션 도구까지 대체할 가능성도 커지고 있다.
챗GPT 에이전트의 등장은 AI와 사람의 관계를 근본부터 뒤흔든다. 단순 비서 역할을 넘어, 사람을 위한 태스크 실행기로 진화한 AI는 이제 조직과 개인의 일하는 방식을 완전히 바꾸려 하고 있다. 이는 디지털 비서에서 디지털 동료로의 진화이자, AI가 단순 조언자를 넘어 실행 주체가 되는 첫걸음일지 모른다.