구글(GOOGL)이 자사 AI 챗봇 애플리케이션인 '제미니(Gemini)'에 새로운 이미지 생성·편집 기능을 접목한 고성능 모델을 추가했다. 이번에 도입된 '제미니 2.5 플래시 이미지(Gemini 2.5 Flash Image)'는 사용자가 자연어로 사진 속 인물, 의상, 배경 등 세부 요소를 직접 수정할 수 있도록 지원하며, AI 기반 이미지 편집 분야의 진화를 한층 앞당기고 있다.
이번 기능이 탑재된 제미니 앱은 사용자의 음성이나 텍스트 명령을 실시간으로 해석해 사진을 자연스럽게 수정할 수 있다. 예를 들어, 기존 사진에서 안경을 추가하거나 의상을 바꾸는 등의 요청을 할 경우, 기존 인물의 외형과 배경을 최대한 보존하면서도 정밀한 결과물을 제공한다. 구글은 이 모델이 연속적인 편집 요청도 자연스럽게 처리할 수 있도록 설계됐다고 강조했다.
제미니 2.5 모델은 초기 개발 단계에서 '나노 바나나(Nano Banana)'라는 코드명으로 실험되어, AI 이미지 품질을 비교 평가하는 공개 플랫폼 'LM아레나(LMArena)'에서 테스트를 거쳤다. 정체불명의 이름에도 불구하고 평론가들과 이용자들 사이에서 빠르게 평가를 끌어올린 이 모델은 세계 최고 수준의 이미지 편집 AI라는 타이틀까지 얻었다. 실제로 다양한 편집 요구에 일관된 품질과 정확도로 대응하며 기술력을 입증했다.
구글 딥마인드(DeepMind) 비주얼 생성 총괄 니콜 브리초바(Nicole Brichtova)는 테크크런치와의 인터뷰에서 "모델의 시각적 품질과 지시 이행 능력을 비약적으로 끌어올렸다"며 "다수의 사용 사례를 고려해 어떤 요청이든 정밀하게 반응하도록 설계했다"고 설명했다.
더불어 제미니 API, 구글 AI 스튜디오, 버텍스 AI 등 구글의 개발자 도구를 통해 해당 이미지 모델을 외부 개발자들이 직접 활용할 수 있게 됐다. 이는 일반 사용자의 편집 수요뿐 아니라, 다양한 소프트웨어나 크리에이티브 플랫폼에도 빠르게 통합될 수 있는 길을 열어준다.
어도비(ADBE)도 이번 모델 통합 계획을 공식화했다. 어도비는 자사의 AI 그래픽 도구인 '파이어플라이(Firefly)'와 '어도비 익스프레스(Adobe Express)'에 제미니 2.5 모델을 내장해 이미지 생성의 정확성과 일관성을 대폭 강화할 방침이다. 이에 따라 사진뿐만 아니라 다양하고 스타일리시한 그래픽 디자인 작업에서도 이 모델이 본격 활용될 전망이다.
제미니 2.5 플래시 이미지 모델의 등장은 생성형 AI 기술이 텍스트 처리 중심에서 이미지 영역으로도 빠르게 확산되고 있다는 방증이다. AI의 시각적 이해력과 표현력이 향상됨에 따라 향후 사진 편집, 콘텐츠 제작, 가상현실 등 여러 산업 분야에서 새로운 혁신의 불씨가 될 것으로 보인다.