RSS VentureBeat
フォロー
「Western Qwen」:IBM、Granite 4 LLMのローンチとハイブリッドMamba/Transformerアーキテクチャで観客を魅了
IBMは、高性能かつ効率的なオープンソースの大規模言語モデル(LLM)の新ファミリである「Granite 4.0」を発表しました。このリリースにより、IBMは特にAlibabaのQwenのような中国製モデルとの競争が激化するLLM分野に再参入します。Granite 4.0は、TransformerとMambaの設計を組み合わせた新しいハイブリッドアーキテクチャを採用しています。Transformerはコンテキスト処理に優れていますが計算コストが高く、一方Mambaは長いシーケンスに対してより効率的です。このハイブリッドアプローチは、両者の強みを活かし、GPUメモリ消費量を70%以上削減することを目指しています。モデルは、商用利用や改変を促進する、寛容なApache 2.0ライセンスの下で提供されます。Granite 4.0は、指示追従と関数呼び出しのベンチマークで高いパフォーマンスを示しています。IBMは、ISO/IEC 42001認証を受けた初のオープンモデルファミリであるGraniteの信頼性と安全性を強調しています。モデルは、エンタープライズ関連のデータセットを含む、22兆トークンの膨大なコーパスでトレーニングされています。IBMは、さまざまなエンタープライズニーズに対応する追加モデルでさらなる拡張を計画しています。Granite 4.0モデルは、Hugging FaceやIBM watsonx.aiなどのプラットフォームからアクセス可能であり、より広範なパートナーサポートが期待されています。このリリースにより、IBMはエンタープライズ対応でコスト効率が高く、安全なAIソリューションのプロバイダーとしての地位を確立します。