E-Ink 新闻日报

返回列表

Gemini 3.1 Flash Live的推出可能让你更难分辨是否在与机器人对话

谷歌发布了Gemini 3.1 Flash Live,这是一款专为实时对话设计的AI音频模型,旨在降低延迟并产生更自然的语音节奏。该模型在复杂任务、推理和处理中断方面的基准测试中表现优异,使得AI语音更难以与人类区分。该模型已在部分谷歌产品中推出,并将供开发者构建对话式AI应用。

背景

历史上,AI生成的文本和音频具有可识别的模式,能揭示其机器来源,但生成式AI的快速改进正使这些区别变得越来越微妙。实时对话式AI一直受限于延迟和不自然的语音节奏,影响了其在流畅类人交互中的可用性。

来源
Ars Technica
发布时间
2026年3月27日 01:44
评分
7.0 / 10