RSS Google 开发者博客 关注 Gemma 3 量子加速器模型:将最先进的 AI 带到消费级 GPU 使用量化感知训练(QAT)优化的 int4 量化版本的 Gemma 3 模型发布,带来了显著降低的内存要求,使用户可以在消费级 GPU seperti NVIDIA RTX 3090 上运行强大的模型,如 Gemma 3 27B。 Gemma 3 QAT Models: Bringing state-of-the-Art AI to consumer GPUs developers.googleblog.com