谷歌为其Gemma 4开源AI模型推出了多令牌预测(MTP)草案器,通过推测性解码预测未来令牌,可将生成速度提高至3倍。这些模型专为在本地硬件上运行而设计,最大版本可在单个高性能AI加速器上以全精度运行。谷歌还将Gemma 4的许可证改为更宽松的Apache 2.0,使开发者更容易使用。
背景
谷歌的Gemma模型是开源AI模型,专为在消费者硬件上本地运行而设计,为基于云的AI系统提供了替代方案。这些模型基于与谷歌Gemini AI相同的技术,但针对边缘计算进行了优化。
- 来源
- Ars Technica
- 发布时间
- 2026年5月6日 23:44
- 评分
- 7.0 / 10