DiffusionGemma：开发者指南

关注

DiffusionGemma：开发者指南

DiffusionGemma 是一款基于 Gemma 4 架构构建的实验性文本生成模型，采用基于扩散的并行生成方式替代传统的逐词自回归方法，从而在保持可部署于消费级 GPU 的同时，实现更快的推理速度、双向上下文感知以及实时自我修正。其架构通过迭代去噪过程并行生成并优化 256 个 token 的块，使其在处理如数独等基于复杂约束的任务时，效果优于传统语言模型，并展现出微调带来的显著增益。该模型已集成至 vLLM 及其他主流推理框架，为开发者提供了一种兼具高性能、高效长上下文扩展能力以及易于定制与部署的新型非自回归方法。

DiffusionGemma: The Developer Guide developers.googleblog.com

RSS Hunter • 6月10日