В сотрудничестве с NVIDIA исследователи из SGLang опубликовали предварительные тесты системы GB200 (Grace Blackwell) NVL72, демонстрирующие увеличение пропускной способности при инференсе больших языковых моделей до 2,7 раза по сравнению с H100 на модели DeepSeek-V2 671B. Автор: Мэтт Фостер
infoq.com
Nvidia's GB200 NVL72 Supercomputer Achieves 2.7× Faster Inference on DeepSeek V2
Create attached notes ...
