In Zusammenarbeit mit NVIDIA haben Forscher von SGLang frühe Benchmarks des GB200 (Grace Blackwell) NVL72-Systems veröffentlicht. Diese zeigen einen Anstieg des LLM-Inferenz-Durchsatzes um bis zu 2,7x im Vergleich zum H100 beim DeepSeek-V2 671B-Modell. Von Matt Foster
infoq.com
Nvidia's GB200 NVL72 Supercomputer Achieves 2.7× Faster Inference on DeepSeek V2
Create attached notes ...
