기업용 인공지능(AI) 도입이 가속화되면서 GPU 가상화 기술이 핵심 인프라 전략으로 부상하고 있다. 초기 테스트 단계에서는 퍼블릭 클라우드가 여전히 유용하지만, 실제 운영에서는 보안성과 성능, 비용 효율을 극대화할 수 있는 프라이빗 클라우드로 무게중심이 옮겨가는 흐름이다.
이런 기술 전환 움직임 속에서 AMD(AMD)와 브로드컴(Broadcom)은 협력을 강화하고 GPU 가상화를 중심에 둔 프라이빗 AI 전용 인프라를 공동 개발 중이다. 이는 AMD의 최신 EPYC 프로세서 및 GPU와 브로드컴 산하의 VMware 솔루션을 결합해 오픈 아키텍처 기반으로 구축된다는 점에서 주목받고 있다. AMD의 전략적 사업개발 부문 부사장 쿠마란 시바는 "고객들로부터 '클라우드에서 PoC, 온프레미스에서 운영'이라는 말을 반복해서 들어왔다"며, "특히 규제를 받는 산업 분야에서는 이러한 모델이 필수"라고 말했다.
이번 협업은 VMware 익스플로어 2025에서 자세히 소개됐다. 애플리케이션 간에 리소스를 효율적으로 공유할 수 있는 GPU 가상화 기술이 중심이었으며, 엔터프라이즈 AI 운영에 있어 고성능 병렬 처리와 신뢰성을 동시에 만족시키는 해법으로 부상하고 있다. VMware 클라우드 파운데이션 부문 제품 담당 부사장 폴 터너는 "여러 애플리케이션 서버가 동일한 추론 모델을 공유해 동시접속성과 유연성이 높아진다"고 설명했다.
GPU 가상화를 기반으로 한 새로운 소프트웨어 스택도 개발 중이다. 벡터 데이터베이스, 모델 매니저 등을 통해 신속한 서비스 배포와 운영 효율성을 제공하며, AMD 측은 이를 통해 기업이 AI 도입 초기부터 확장까지 완전한 제어권을 유지할 수 있다고 강조했다. 시바는 "GPU를 쉽게 사용할 수 있도록 VMware와 구성요소 최적화 작업을 긴밀히 진행하고 있다"고 전했다.
업계는 이 같은 변화가 단순한 기술 고도화를 넘어 기업의 리소스 활용도를 극대화하고 있다는 점에 주목하고 있다. AI 워크로드 운영이 일상화되면서 SLA 응답 시간 준수, 작업 배치 최적화, 병목 해소 등 IT 전략 전반의 성능을 GPU 가상화가 좌우하게 된 것이다. 터너는 "GPU 가상화 없이는 프라이빗 클라우드를 제대로 운영하기 어렵다"며, "AMD와 함께 GPU 풀 기반 자원 스케줄링 환경을 구축하고 있다"고 설명했다.
AMD와 VMware 간 하드웨어와 소프트웨어의 밀착 통합도 중요한 포인트다. AMD의 EPYC CPU 기반 가상화 경험을 GPU로 확장하려는 시도가 지속 중이며, 이는 AI 모델 간 실시간 이동성과 고효율 연산 환경 구현이 가능하다는 뜻이다. 시바는 "CPU 환경에서 수많은 기업 애플리케이션을 원활히 운영한 것처럼, GPU에서도 동일한 수준의 유연성과 안정성을 실현해가고 있다"고 강조했다.
기업들은 AI 인프라 구축 시 단순 성능보다 장기적인 확장성, 보안, 운영 편의성을 중시하고 있다. 이런 관점에서 AMD와 브로드컴의 가상화 중심 파트너십은 프라이빗 AI 환경에 가장 실질적인 접근법으로 평가 받는다. AI가 실제 비즈니스 가치로 이어지기 위해서는 이처럼 가시적인 인프라 혁신과 기술 간 협력이 뒷받침되어야 한다.