中国電信は、国産のAIチップを使用して2つの大規模な言語モデルを開発したと報告されており、これは中国が半導体の独立を目指す上で重要な里程標となっている。アメリカが中国への高性能チップの供給を禁止する規制を強化している中で、この成果は重要なものとなっている。中国の地元チップ業界を牽引する企業である華為技術(Huawei)は、この開発に重要な役割を果たしたと考えられている。中国電信のモデルが華為のチップのみを使用してトレーニングされた場合、華為と中国政府にとって大きな成功となるだろう。プロジェクトのGitHubページは、華為のAscend Atlas 800T A2トレーニングサーバーを使用したことを示唆しており、このサーバーはKunpeng 920プロセッサをサポートしている。これらのプロセッサは、Arm 8.2アーキテクチャを使用し、7nmプロセスで製造されている。2つのモデルの中で、1つは1兆パラメータを備え、もう1つはTeleChat2t-115Bと呼ばれ、100億パラメータを超える。中国の半導体業界にとって、この開発は大きな前進となる。中国の目標は、半導体の需要を満たすために他の国に依存しないことである。米中のチップ戦争により、中国へのチップ供給が制限される中で、この成果はさらに重要性を増す。
hardware.slashdot.org
China Trained a 1-Trillion-Parameter LLM Using Only Domestic Chips
