RSS Slashdot

Microsoft-Forscher entwickeln hoch-effizientes KI-Modell, das auf CPUs laufen kann.

Microsoft hat BitNet b1.58 2B4T vorgestellt, ein großes 1-Bit-KI-Modell mit 2 Milliarden Parametern, das effizient auf CPUs läuft. Das Modell ist unter einer MIT-Lizenz frei verfügbar, was eine weitverbreitete Nutzung und Entwicklung ermöglicht. Laut Microsoft-Forschern ist BitNet b1.58 2B4T das erste BitNet mit 2 Milliarden Parametern, die größtenteils synonym mit Gewichten sind. Das Modell wurde auf einer riesigen Datenmenge von 4 Billionen Token trainiert, was etwa 33 Millionen Büchern entspricht. Diese Ausbildung ermöglicht es BitNet b1.58 2B4T, traditionelle Modelle ähnlicher Größe zu übertreffen, wie die Forscher behaupten. Die Leistung des Modells ist bemerkenswert, da es sich gegenüber konkurrierenden Modellen mit 2 Milliarden Parametern behaupten kann, obwohl es sie nicht wesentlich übertreffen kann. BitNet b1.58 2B4T übertrifft andere Modelle, einschließlich Meta's Llama 3.2 1B und Google's Gemma 3 1B, in bestimmten Benchmarks. Die Geschwindigkeit und Effizienz des Modells sind ebenfalls beeindruckend, da es doppelt so schnell ist wie andere Modelle seiner Größe und nur einen Bruchteil des Speichers verwendet. Allerdings erfordert die Erreichung dieser Leistung die Verwendung von Microsofts benutzerdefiniertem Framework, bitnet.cpp, das derzeit nur mit bestimmten Hardware-Komponenten funktioniert. Die begrenzte Kompatibilität des Frameworks, die GPUs ausschließt, kann eine erhebliche Einschränkung für die weitverbreitete Übernahme von BitNet b1.58 2B4T sein.
favicon
slashdot.org
Microsoft Researchers Develop Hyper-Efficient AI Model That Can Run On CPUs
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app