인공지능(AI)의 급속한 발전이 클라우드 네이티브 생태계에 새로운 동력을 불어넣고 있다. 미국 애틀랜타에서 열린 'KubeCon/CloudNativeCon North America 2025'에서는 플랫폼 엔지니어링이 다시 주목받고 있으며, AI와 Kubernetes 기반 개발이 결합되면서 클라우드 인프라가 근본적으로 재편되고 있다. 전문가들은 이제 대부분의 개발자들이 AI 도구를 활용하고 있으며, 이로 인해 AI에 최적화된 플랫폼 아키텍처 구축이 진화하고 있다고 진단했다.
특히 이번 행사에서는 'Kubernetes AI 적합성 인증 프로그램'이 공개돼 주목받았다. 이는 AI 워크로드를 다양한 인프라 환경에서 예측 가능하고 이동 가능하도록 표준화하는 데 목적이 있다. 동적 자원 할당 기능도 소개되었는데, GPU와 TPU 등 다양한 하드웨어에서 AI 성능을 최적화할 수 있도록 설계됐다.
플랫폼 엔지니어링의 실전 활용 사례도 속속 등장하고 있다. 플랫폼 엔지니어링 랩스는 인프라 상태를 추상화해 코드 변경 사항을 통합 관리하는 'Formæ'를 공개하며, 개발자가 복잡한 네트워크나 데이터베이스 설정에 얽매이지 않고 애플리케이션을 구축할 수 있도록 돕고 있다. 오픈소스 참여 경험이 플랫폼 엔지니어 채용 시 경쟁력이 된다는 현장의 목소리도 이어졌다.
AI 시대에 접어들면서 네트워크와 인프라 계층에서도 대대적인 최적화가 진행 중이다. 에데라(Edera)는 최소화된 컨테이너 실행 환경을 위한 보안 런타임을 내놓았고, 티게라(Tigera)는 자연어 기반 네트워크 문제 해결 기능을 탑재한 'Calico AI 어시스턴트'를 선보였다. 플록스(Flox)는 Nix에 기반한 새로운 실행 환경을 제시하며 컨테이너 오버헤드를 줄이고 보안 취약점 발생 가능성을 낮추는 방향으로 진화하고 있다.
보안을 강화하기 위한 움직임도 빨라지고 있다. 소프트웨어 공급망 공격이 늘고 있는 가운데, 오픈SSF는 다양한 비핵심 Kubernetes 요소에 대한 감사 활동을 통해 취약점을 찾아내는 데 집중하고 있다. 클라우드스미스(Cloudsmith)와 쿠사리(Kusari)는 AI 기반 코드 분석 도구와 레지스트리 스캐닝 플랫폼을 통해 안전한 개발 환경을 제공하는 데 나섰다.
AI SRE라는 새로운 개념도 등장했다. 이 개념은 AI를 활용해 실시간 장애 감지와 원인 분석, 자동 복구 기능을 통합한 것인데, 컨트롤씨어리(ControlTheory)는 이를 위한 터미널 UI 'Gonzo'와 추세 분석 도구 'Dstl8'를 공개했다. 코모도르(Komodor)는 자율 복구 기능을 내장한 챗봇 'Klaudia'를 통해 현장 사용자들이 실제 운영 환경에서 빈번하게 발생하는 문제를 자동화된 방식으로 처리할 수 있도록 했다.
마지막으로 테스트 분야에서도 AI가 적용되고 있다. 테스트큐브(Testkube)는 다중 에이전트 기반의 분산 테스트 방식을 통해 코드의 유효성과 경향성을 분석하고 있으며, AI 모델 변화에 따른 테스트 왜곡 현상까지 고려한 대책이 논의되고 있다. 이는 AI 코드 생성 속도가 높아지는 상황에서 위험을 사전에 방지하는 전략으로 주목받고 있다.
KubeCon NA 2025는 플랫폼 엔지니어링의 부활이라는 흐름 속에서 AI 기술이 클라우드 네이티브 개발을 어떻게 재정의하고 있는지를 실감케 한 자리였다. 복잡성이 증가하는 가운데 커뮤니티는 활발한 협업과 오픈소스 참여를 통해 AI 시대에 적합한 인프라 운영 모델을 발전시키고 있다. AI가 전면에 등장하는 시대, Kubernetes 생태계는 여전히 진화 중이다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>