오픈AI, 이미지 생성 AI 'GPT 이미지 1.5' 공개…속도·정밀도·원가 모두 잡았다

| 김민준 기자

오픈AI(OpenAI)가 이미지 생성과 편집에 특화된 새로운 인공지능 모델인 GPT 이미지 1.5(GPT Image 1.5)를 선보였다. 이번 모델은 기존 이미지 생성 기능의 한계를 개선하면서도 처리 속도와 정확도를 동시에 높여, 상용 및 일반 사용자 모두를 위한 성능 최적화가 이뤄졌다는 평가다.

GPT 이미지 1.5는 구글(GOOGL)이 최근 발표한 이미지 생성 모델 '나노 바나나 프로(Nano Banana Pro)'와 비슷한 시기 출시된 것으로, 이미지 내 텍스트 구현력과 후속 프롬프트에 대한 이해도가 크게 향상된 것이 특징이다. 특히 OpenAI는 이번 모델이 소형 텍스트와 밀집된 정보가 포함된 이미지 편집 작업에 뛰어난 성능을 보여, 인포그래픽 제작과 같은 복합 작업에 적합하다고 강조했다.

일반 사용자들은 챗GPT(ChatGPT) 내 이미지 생성 기능을 통해 GPT 이미지 1.5를 이용할 수 있고, 개발자들은 응용 프로그램 인터페이스(API)를 통해 접속 가능하다. OpenAI는 이 API의 가격을 이전 모델 대비 20% 낮췄으며, 모델의 연산 효율이 향상된 만큼 이미지 생성 속도도 기존 대비 최대 4배 빨라졌다고 설명했다. 이는 곧 서버 비용과 에너지 사용량 감소로도 이어질 수 있어 기업 입장에서는 활용 메리트가 크다.

또한 이번 GPT 이미지 1.5 모델은 복잡한 다단계 이미지 편집에도 강점을 보인다. 예를 들어 서로 다른 3개의 그림에서 요소를 추출해 하나의 이미지로 합성한 후, 전체 스타일을 일괄 변경하는 고난이도 작업을 원활하게 수행한다. 어떤 요소를 변경하고 무엇은 그대로 둘지를 정확히 판단하기 때문에 브랜드 이미지나 로고를 수정 없이 편집해야 하는 상업적 쓰임새에도 적합하다.

OpenAI 측은 이 모델이 특정 스타일이나 과학 지식이 필요한 이미지 생성에는 제한이 있을 수 있다고 밝혔으나, 전작보다 관련 작업에서의 오류율은 눈에 띄게 줄었다고 설명했다. 새로운 모델은 챗GPT 내 별도의 인터페이스를 통해 접근할 수 있고, 사용자 맞춤 프롬프트 추천과 이미지 필터도 함께 제공될 예정이다.

이번 발표는 GPT-5.2 모델의 출시 직후 이루어졌다. GPT-5.2는 고등 교육 수준의 과학 및 수학 문제 해결 능력을 입증하며, AI 벤치마크 최고 기록을 경신한 바 있다. 이를 바탕으로 OpenAI는 최근 자사 전용 벤치마크인 프론티어사이언스(FrontierScience)를 출시했으며, 약 700개 이상의 물리, 화학, 생물학 분야 질문으로 구성된 이 지표를 통해 자사 알고리즘의 과학 분야 적용력을 점검하고 있다.

AI 이미지 생성 기술의 발전이 가속화되는 상황에서 GPT 이미지 1.5의 등장은 OpenAI가 이미지 처리 영역에서도 주도권 강화를 목표로 하고 있음을 보여준다. 원가 절감, 속도 향상, 정밀도 개선이라는 세 가지 축을 동시에 충족한 이번 모델은 향후 다양한 상업용 콘텐츠 제작 환경에서 핵심 AI로 자리잡을 가능성이 높다.