E-Ink 新闻日报

返回列表

DSpark:投机解码加速LLM推理

DeepSeek推出了DSpark,这是一种投机解码方法,通过利用小型草稿模型并行预测多个令牌,显著加速了大语言模型的推理过程。该方法在不增加硬件资源的情况下降低了延迟并提高了吞吐量,具有很高的部署实用性。

背景

投机解码是一种新兴技术,旨在通过使用较小、较快的模型提出候选令牌供大型目标模型验证,从而加速自回归生成过程。

来源
Hacker News (RSS)
发布时间
2026年6月27日 17:18
评分
8.0 / 10