谷歌DeepMind发布DiffusionGemma：本地AI运行速度提升4倍的模型

Ars Technica

Ryan Whitwam

2026年6月11日 03:297.0/10

谷歌DeepMind发布了DiffusionGemma，这是一种新型开源AI模型，采用并行块而非顺序方式生成文本，速度比传统自回归模型快4倍。这个拥有260亿参数、推理时仅激活38亿参数的专家混合模型，可在游戏GPU等本地硬件上运行。在H100加速器上每秒可生成1000多个token，在文本编辑和分子建模等领域具有应用潜力。

背景

传统的AI语言模型（如GPT）采用自回归生成方式，逐个token顺序生成文本，计算强度大且速度较慢。谷歌的新方法将图像生成中的扩散技术应用于文本，实现了并行处理以加快输出速度。

来源: Ars Technica
发布时间: 2026年6月11日 03:29
评分: 7.0 / 10

阅读原文 →