中 AI 스타트업 딥시크, 화웨이 칩 결함에 R2 출시 ‘제동’

| 김민준 기자

중국 인공지능(AI) 스타트업 딥시크(DeepSeek)가 차기 대형 언어모델 ‘R2’ 출시를 당초 계획보다 지연시키게 된 배경에 화웨이(Huawei) 칩셋의 기술적 결함이 작용한 것으로 알려졌다. 이는 미국 기술에 대한 의존도를 줄이려는 중국 정부의 정책 기조가 오히려 자국 AI 생태계의 발목을 잡는 역설적 상황을 드러낸다.

로이터 통신은 내부 사정에 정통한 복수의 소식통을 인용해, 딥시크는 애초 차세대 모델인 R2를 화웨이의 ‘Ascend’ GPU로 훈련시키려 했지만, 수차례 시도에도 성능 저하 및 안정성 문제로 결국 엔비디아(NVDA) 그래픽칩으로 회귀했다고 전했다. 단, 추론 단계에서는 여전히 일부 Ascend 칩을 활용 중이라고 덧붙였다.

딥시크는 연초 자사 첫 대형 언어모델 ‘R1’를 공개하며 기존 미·중 빅테크를 긴장시켰다. 당시 R1은 수백억 매개변수 규모임에도 ‘수백만 달러 수준’의 비용으로 훈련됐다고 밝혀 업계를 놀라게 했다. 반면, 오픈AI나 구글(GOOGL)은 모델 훈련에 수십억 달러를 쏟아붓고 있다.

그러나 예상치 못했던 리스크는 미국 정부의 조치에서 시작됐다. 트럼프 대통령은 지난 4월 엔비디아의 중국 내 H20 GPU 수출을 전면 금지하는 조치를 단행했다. 이에 중국 당국은 자국 AI 스타트업에 자국산 칩 사용을 강하게 권고했고, 딥시크도 이에 따라 화웨이 GPU를 채택하게 됐다.

문제는 성능이었다. AI 모델 훈련에 요구되는 고성능·고안정성 요건을 충족하지 못한 것이다. 딥시크는 이후 엔비디아 칩으로 다시 회귀해 훈련을 이어갔지만, 이로 인해 R2 출시는 여전히 미뤄지고 있으며, 그 사이 미국의 경쟁 모델들이 성능과 시장 점유율 모두에서 앞서 나가고 있다.

전문가들은 이번 사태를 통해 중국 반도체 산업의 현실적인 약점을 다시금 목격했다고 평가한다. 캘리포니아대 버클리 캠퍼스의 AI 연구자인 리트윅 굽타(Ritwik Gupta)는 “Ascend 칩 자체보다는 관련 소프트웨어와 칩 간 연결 성능이 엔비디아에 비해 떨어진다”고 지적하며, “화웨이가 AI 훈련 분야에서 성장통을 겪고 있지만 장기적으로는 개선의 여지가 있다”고 평가했다.

한편, 화웨이는 최근 자체 AI 서버 ‘CloudMatrix 384’를 공개하며 반격에 나섰다. 총 384개의 Ascend 910C GPU가 장착된 이 신형 서버는 이론상 엔비디아의 고성능 서버보다 더 많은 연산처리 성능과 메모리, 대역폭을 제공한다. 다만 전력 소모가 상당하고, 실성능 검증은 아직 미비하다는 비판도 공존한다.

딥시크의 창업자 량원펑은 내부 직원에게 R2의 진척에 실망감을 표하며 모델 정비 및 경쟁력 개선에 더 많은 시간을 투입하겠다는 뜻을 밝힌 것으로 전해진다. 반면 중국 현지 매체에 따르면 R2는 이르면 수 주 내 공식 발표될 수 있다는 기대도 고조되고 있다.

이번 사태는 글로벌 AI 패권 경쟁에서 기술 자립의 중요성을 다시 부각시키는 계기가 됐다. 하지만 외부 압박 속에서 자국 기술만으로 일정 수준의 퀄리티와 속도를 확보하지 못하는 한, 중국의 자립 전략은 정체될 수밖에 없다는 사실도 함께 보여주고 있다.