RSS Cloudflare 博客 关注 Workers AI 获得速度提升、批量工作负载支持、更多 LoRAs、新模型和刷新的仪表盘 我们刚刚使用推测解码和前缀缓存使 Workers AI 推理更快。现在使用我们的新批量推理来无缝处理大量请求量。 Workers AI gets a speed boost, batch workload support, more LoRAs, new models, and a refreshed dashboard blog.cloudflare.com