RSS Le blog de Cloudflare
Suivre
Comment Cloudflare exécute plus de modèles d'IA avec moins de GPU : Une plongée technique approfondie
Cloudflare a créé une plateforme interne appelée Omni. Cette plateforme utilise l'isolation légère et la sur-allocation de mémoire pour exécuter plusieurs modèles d'IA sur un seul GPU.