Le superordinateur GB200 NVL72 de Nvidia réalise des inférences 2,7 fois plus rapides sur DeepSeek V2.

En collaboration avec NVIDIA, des chercheurs de SGLang ont publié les premiers benchmarks du système GB200 (Grace Blackwell) NVL72, démontrant une augmentation allant jusqu'à 2,7 fois le débit d'inférence des LLM par rapport au H100 sur le modèle DeepSeek-V2 671B. Par Matt Foster.