RSS InfoQ

Суперкомпьютер Nvidia GB200 NVL72 обеспечивает в 2,7 раза более быстрое выполнение инференса на DeepSeek V2

В сотрудничестве с NVIDIA исследователи из SGLang опубликовали предварительные тесты системы GB200 (Grace Blackwell) NVL72, демонстрирующие увеличение пропускной способности при инференсе больших языковых моделей до 2,7 раза по сравнению с H100 на модели DeepSeek-V2 671B. Автор: Мэтт Фостер
favicon
infoq.com
Nvidia's GB200 NVL72 Supercomputer Achieves 2.7× Faster Inference on DeepSeek V2
Изображение к статье: Суперкомпьютер Nvidia GB200 NVL72 обеспечивает в 2,7 раза более быстрое выполнение инференса на DeepSeek V2
Create attached notes ...