マイクロソフトは、CPU上で効率的に実行できる大規模の1ビットAIモデル、BitNet b1.58 2B4Tを導入しました。このモデルは、MITライセンスの下で公開されており、広範囲にわたる使用と開発を可能にしています。マイクロソフトの研究者によると、BitNet b1.58 2B4Tは、2億のパラメータを持つ初めてのビットネットであり、これらのパラメータは主に重みに相当します。このモデルは、約4兆トークンの巨大なデータセットでトレーニングされ、これは約330万冊の本に相当します。このトレーニングにより、BitNet b1.58 2B4Tは、同サイズの従来のモデルを上回る性能を示すと主張されています。このモデルの性能は、競合する2億パラメータのモデルに対しては、特に優れているわけではありませんが、同等の性能を示しています。BitNet b1.58 2B4Tは、MetaのLlama 3.2 1BやGoogleのGemma 3 1Bを含む他のモデルを、特定のベンチマークで上回ります。また、このモデルの速度と効率も印象的であり、同サイズのモデルに対しては2倍の速度で、メモリーの小さい割合で実行できます。ただし、この性能を達成するには、マイクロソフトのカスタムフレームワーク、bitnet.cppを使用する必要があり、これは現在、特定のハードウェアでのみ動作します。このフレームワークの限定的な互換性、特にGPUを除外することは、BitNet b1.58 2B4Tの広範囲な採用にとって大きな制限となる可能性があります。
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
slashdot.org
Microsoft Researchers Develop Hyper-Efficient AI Model That Can Run On CPUs
