중국은 자국산 칩만을 사용하여 1조 개의 매개변수 LLM을 훈련시켰습니다.

중국 텔레콤은 국내에서 제조된 AI 칩을 사용하여 두 개의 대규모 언어 모델을 개발했다고 보도되었다. 이는 중국이 반도체 독립을 추구하는 과정에서 중요한 이정표이다. 미국이 중국에 고성능 칩 공급을 금지하는 규제를 강화하고 있는 상황에서 이 성과는 매우 중요하다. 중국의 반도체 산업을 이끄는 회사 중 하나인 화웨이는 이 개발에 중요한 역할을 했다고 믿어진다. 중국 텔레콤의 모델이 화웨이 칩만을 사용하여 훈련되었다면, 이는 화웨이와 중국 정부에 큰 성공이 될 것이다. 이 프로젝트의 깃허브 페이지는 화웨이의 Ascend Atlas 800T A2 훈련 서버를 사용했음을 암시하고 있으며, 이 서버는 Kunpeng 920 프로세서를 지원한다. 이 프로세서는 Arm 8.2 아키텍처를 사용하고 7nm 공정을 사용한다. 두 모델 중 하나는 1조 개의 매개변수를 가지고 있으며, 다른 하나인 TeleChat2t-115B는 100억 개 이상의 매개변수를 가지고 있다. 이 개발은 중국의 반도체 산업에 중요한 발전이다. 중국의 목표는 반도체에 대한 다른 국가의 의존성을 없애는 것이다. 미국과 중국의 칩 전쟁으로 인해 중국에 대한 칩 공급이 제한되면서 이 성과는 더욱 두드러진다.

hardware.slashdot.org

China Trained a 1-Trillion-Parameter LLM Using Only Domestic Chips

RSS Hunter

2024-10-06