RSS Le blog de Cloudflare
Suivre
Workers AI bénéficie d'une amélioration de vitesse, d'un support de charge de travail par lot, de plus de LoRAs, de nouveaux modèles et d'un tableau de bord rafraîchi
Nous venons de rendre l'inférence AI des Workers plus rapide grâce au décodage spéculatif et au cache de préfixe. Utilisez notre nouvelle inférence par lots pour gérer les grands volumes de requêtes de manière transparente.