谷歌DeepMind发布了DiffusionGemma,这是一种新型开源AI模型,采用并行块而非顺序方式生成文本,速度比传统自回归模型快4倍。这个拥有260亿参数、推理时仅激活38亿参数的专家混合模型,可在游戏GPU等本地硬件上运行。在H100加速器上每秒可生成1000多个token,在文本编辑和分子建模等领域具有应用潜力。
背景
传统的AI语言模型(如GPT)采用自回归生成方式,逐个token顺序生成文本,计算强度大且速度较慢。谷歌的新方法将图像生成中的扩散技术应用于文本,实现了并行处理以加快输出速度。
- 来源
- Ars Technica
- 发布时间
- 2026年6月11日 03:29
- 评分
- 7.0 / 10