Workers AI bénéficie d'une amélioration de vitesse, d'un support de charge de travail par lot, de pl

Suivre

Workers AI bénéficie d'une amélioration de vitesse, d'un support de charge de travail par lot, de plus de LoRAs, de nouveaux modèles et d'un tableau de bord rafraîchi

Nous venons de rendre l'inférence AI des Workers plus rapide grâce au décodage spéculatif et au cache de préfixe. Utilisez notre nouvelle inférence par lots pour gérer les grands volumes de requêtes de manière transparente.

Workers AI gets a speed boost, batch workload support, more LoRAs, new models, and a refreshed dashboard blog.cloudflare.com

RSS Hunter • 11 avr. 2025