애플(AAPL)의 머신러닝 연구팀이 생성형 AI 분야에서 파급력을 지닌 신기술을 공개했다. '스타플로(STARFlow)'로 명명된 이 시스템은 기존 딥러닝 기반 이미지 생성 방식인 확산 모델(diffusion model)의 아성에 도전장을 내밀며, 고해상도 이미지 생성에서 새로운 가능성을 제시하고 있다.
애플은 최근 학계 협력자들과 함께 발표한 논문을 통해 스타플로의 기술적 핵심을 소개했다. 이 모델은 기존 확산 모델과 달리 정규화 흐름(normalizing flow)을 기반으로 하면서도 성능 저하 없이 텍스트 기반 이미지 생성, 클래스 조건 이미지 생성 등 다양한 과제에서 준수한 성능을 기록했다. 연구팀은 “이 스케일과 해상도에서 정규화 흐름이 효과적으로 동작하는 것은 처음”이라며 기술의 진보를 강조했다.
이번 진전은 애플이 하드웨어와 소프트웨어 통합 강점을 살려 AI 영역에서 차별화된 전략을 구축하려는 시도의 일환으로 해석된다. 구글(GOOGL), 오픈AI(OpenAI) 등 경쟁사들이 생성형 AI의 주도권을 잡은 가운데, 애플은 하향 평을 받고 있는 시리(Siri)를 넘어서기 위한 연구개발에 투자해 왔다. 지난 세계 개발자 회의(WWDC)에서도 애플은 자사 AI 플랫폼 ‘애플 인텔리전스’에 대한 변화가 미미하다는 평가를 들었고, 이번 연구성과는 이에 대한 반격으로 보인다.
스타플로가 주목받는 이유는 단순한 성능이 아닌 접근 방식에서의 차이점 때문이다. 해당 모델은 사전학습된 오토인코더의 잠재 공간(latent space)을 활용해 연산 효율성을 높였으며, 픽셀 단위 처리보다는 압축된 표현을 조작함으로써 속도와 품질을 모두 개선하는 데 성공했다. 특히 점진적 복원 과정이 필요한 확산 모델과 달리, 스타플로는 본질적으로 확률론적 정밀 추론이 가능한 구조를 유지하고 있어 ‘정확한 최대 우도 학습’을 지원한다는 점에서 현실적 활용 가능성이 높게 평가된다.
해당 연구를 이끈 지아타오 구, 조슈아 M. 서스킨드, 장솽페이 자이 등의 애플 연구팀은 버클리 캘리포니아대(UC Berkeley), 조지아 공대(Georgia Tech) 등의 학자들과 협업 체계를 구축하며, 기술 고도화에 힘을 실었다. 특히 스타플로는 계산 복잡도와 성능을 균형 있게 조율하기 위한 ‘딥-셸로우 구조’를 적용해, 집중도가 높은 딥 트랜스포머 블록과 효율적인 셸로우 블록을 조합하는 방식을 채택했다.
이번 논문은 오픈 액세스 플랫폼 아카이브(arXiv)를 통해 전세계 연구자들과 엔지니어가 자유롭게 활용할 수 있게 공개됐다. 다만 애플에게 주어진 과제는 이제부터다. 해당 기술을 실제 상품으로 구현해 아이폰 또는 맥 제품에 자연스럽게 통합하고, 구체적인 사용자 경험 향상으로 이어질 수 있어야 한다. 생성형 AI가 점점 일상의 중심으로 진입하고 있는 지금, 애플이 이 방향성을 얼마나 빠르고 독창적으로 구현하느냐에 따라 AI 경쟁력의 향방이 엇갈릴 것이다.