RSS Блог разработчиков Google
Подписаться
DiffusionGemma: Руководство разработчика
DiffusionGemma — это экспериментальная модель генерации текста, построенная на архитектуре Gemma 4, которая использует диффузионную параллельную генерацию вместо авторегрессии токен за токеном, что обеспечивает гораздо более быструю инференцию, двустороннюю контекстную осведомленность и самокоррекцию в реальном времени, оставаясь при этом развертываемой на потребительских графических процессорах. Ее архитектура параллельно генерирует и уточняет блоки из 256 токенов посредством итеративного шумоподавления, что позволяет ей более эффективно, чем традиционные языковые модели, справляться со сложными задачами, основанными на ограничениях, такими как Судоку, и демонстрировать значительный прирост от дообучения. Модель интегрируется с vLLM и другими популярными фреймворками инференции, предоставляя разработчикам доступ к новому неавторегрессивному подходу, который сочетает в себе высокую производительность, эффективное масштабирование длинного контекста, а также простую настройку и развертывание.