小米发布MiMo-v2.5-Pro-UltraSpeed：每秒处理1000个token的1T参数模型

Hacker News (RSS)

GAgainsurier

2026年6月8日 23:278.0/10

小米宣布推出MiMo-v2.5-Pro-UltraSpeed，这是一个拥有1万亿参数的大型模型，能够每秒处理1000个token，代表了AI推理速度的重大飞跃。该模型展示了小米在大型语言模型开发和优化方面日益增长的能力。这一突破可能对实时AI应用和边缘计算部署产生重大影响。

大型语言模型发展迅速，重点既包括增加模型规模，也包括提高推理速度。实现高token处理速率对于实时应用和AI系统的高效部署至关重要。