E-Ink 新闻日报

返回列表

谷歌DeepMind发布DiffusionGemma:本地AI运行速度提升4倍的模型

谷歌DeepMind发布了DiffusionGemma,这是一种新型开源AI模型,采用并行块而非顺序方式生成文本,速度比传统自回归模型快4倍。这个拥有260亿参数、推理时仅激活38亿参数的专家混合模型,可在游戏GPU等本地硬件上运行。在H100加速器上每秒可生成1000多个token,在文本编辑和分子建模等领域具有应用潜力。

背景

传统的AI语言模型(如GPT)采用自回归生成方式,逐个token顺序生成文本,计算强度大且速度较慢。谷歌的新方法将图像生成中的扩散技术应用于文本,实现了并行处理以加快输出速度。

来源
Ars Technica
发布时间
2026年6月11日 03:29
评分
7.0 / 10