DiffusionGemma:开发者指南
DiffusionGemma 是一款基于 Gemma 4 架构构建的实验性文本生成模型,采用基于扩散的并行生成方式替代传统的逐词自回归方法,从而在保持可部署于消费级 GPU 的同时,实现更快的推理速度、双向上下文感知以及实时自我修正。其架构通过迭代去噪过程并行生成并优化 256 个 token 的块,使其在处理如数独等基于复杂约束的任务时,效果优于传统语言模型,并展现出微调带来的显著增益。该模型已集成至 vLLM 及其他主流推理框架,为开发者提供了一种兼具高性能、高效长上下文扩展能力以及易于定制与部署的新型非自回归方法。