구글, '제미니 2.5 플래시 이미지' 출시… 생성형 AI 편집 전쟁 본격화

| 김민준 기자

구글(GOOGL)이 최근 출시한 '제미니 2.5 플래시 이미지(Gemini 2.5 Flash Image)'는 이미지 편집 작업의 일관성과 제어력을 대폭 강화하며 기업용 생성형 AI 시장을 겨냥하고 있다. 내부적으로 '나노바나나(Nanobanana)'란 코드명으로 알려졌던 이 모델은 이전 버전에 비해 다양한 이미지 속성의 정밀한 유지와 변형 요구에 보다 세밀하게 대응하도록 설계됐다. 사용자들은 제미니 앱에서 이 기능을 활용해 텍스트 지시만으로도 사진 속 배경을 바꾸거나 소품을 더하는 작업을 손쉽게 처리할 수 있다.

이번 모델은 기존 제미니 2.5 플래시를 기반으로 고도화된 버전으로, 특히 얼굴이나 반려동물 사진 편집 시 피사체의 정체성을 왜곡하지 않고 반복적인 작업에서도 일관성을 유지하는 점에서 주목받는다. 예컨대, 반려견 사진에 모자를 씌우거나 배경을 바꾸는 과정에서도 개의 표정이나 모습이 원본과 거의 동일하게 유지된다. 구글은 담대한 목표를 공개하며, "가까운 사람이나 본인의 모습을 편집할 경우 아주 작은 차이도 매우 중요하다"며, 이를 해결하기 위해 이번 기능을 도입했다고 밝혔다.

새 모델은 유료 및 무료 사용자 모두가 활용할 수 있으며, 구글의 'SynthID' 워터마크가 자동 삽입되어 생성된 이미지임을 명확히 한다. 이는 생성형 이미지의 투명성과 무단 사용 방지를 위한 조치다. 기업 입장에선 내장 편집 도구를 통해 복잡한 워크플로의 간소화와 작업 효율성을 크게 높일 수 있으며, 이를 통해 제품 이미지, 마케팅 자료, 교육 콘텐츠 제작 등 다양한 분야에서 활용도가 기대된다.

이 모델에 대한 관심은 출시 전부터 이미 뜨거웠다. 생성형 AI 커뮤니티 플랫폼인 'LM 아레나'에서는 나노바나나라는 이름의 미공개 모델에 대한 추측이 쏟아졌으며, 일부 사용자는 이 모델이 복잡한 다단계 지시를 놀랍도록 정확하게 수행한다고 평가했다. 이후 구글 출신임이 사실상 확인되면서 기대감은 더욱 확산됐다.

경쟁 역시 치열하다. 오픈AI는 챗GPT(ChatGPT)에 네이티브 이미지 편집 기능을 추가하고 이를 API로도 제공하고 있으며, 큐웬(Qwen)도 최근 이미지 편집 기능을 강화한 모델을 출시했다. 여기에 어도비(Adobe)가 대표 이미지 편집 툴 포토샵에 자체 모델 '파이어플라이(Firefly)'를 탑재하면서 전통 강자의 저력도 여전히 유효하다. 각각의 기업들은 정확도, 속도, 일관성 등의 측면에서 차별화된 기능을 내세우며 사용자들의 선택을 유도하고 있다.

구글은 올 3월 제미니 앱에 AI 기반 기본 이미지 편집 기능을 도입하며, 대화형 플랫폼에서 바로 사진을 편집할 수 있는 환경을 제공한 바 있다. 사용자는 사진을 업로드한 뒤 텍스트 명령어를 입력해 결과물을 실시간으로 확인하고, 필요시 이를 다시 영상 등으로 확장 생산하는 것이 가능하다. 한 장의 사진 스타일을 다른 사진에 적용하거나, 두 이미지를 병합하는 등 다단계 편집 작업도 수행할 수 있다.

궁극적으로 이번 업데이트는 생성형 AI 모델 간 경쟁에서 기술 우위를 확보하기 위한 구글의 전략적 움직임으로 해석된다. 이제 사용자들은 포토샵 수준의 복합 편집 작업을 별도 전문 도구 없이도 수행할 수 있으며, 이는 대규모 콘텐츠 생산 및 창의적 프로젝트를 진행하는 기업들에게 상당한 비용 절감과 생산성 향상을 의미한다. 다만, 여전히 일부 깨짐 현상이나 변화의 미묘한 오차 등 해결해야 할 과제도 남아 있으며, 앞으로의 추가 개선 여부가 주목된다.