RSS Cloudflare 博客 关注 我们如何为 Cloudflare 网络构建最高效的推理引擎 Infire 是一个 LLM 推理引擎,它采用了一系列技术来最大限度地提高资源利用率,从而使我们能够更有效地为 Cloudflare 工作负载提供 AI 模型,并获得更好的性能。 How we built the most efficient inference engine for Cloudflare’s network blog.cloudflare.com AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app