RSS Le blog de Cloudflare
Suivre
Comment nous avons construit le moteur d'inférence le plus efficace pour le réseau de Cloudflare
Infire est un moteur d'inférence LLM qui emploie un éventail de techniques pour maximiser l'utilisation des ressources, nous permettant de servir des modèles d'IA plus efficacement avec de meilleures performances pour les charges de travail Cloudflare.