RSS クラウドフレア ブログ フォロー Cloudflareは、より少ないGPUでより多くのAIモデルをどのように実行するか:技術的詳細 CloudflareはOmniという社内プラットフォームを構築しました。このプラットフォームは、軽量な分離とメモリのオーバーコミットメントを使用して、単一のGPUで複数のAIモデルを実行します。 How Cloudflare runs more AI models on fewer GPUs: A technical deep-dive blog.cloudflare.com AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app