Gemini 3.1 Flash Live的推出可能让你更难分辨是否在与机器人对话

Ars Technica

Ryan Whitwam

2026年3月27日 01:447.0/10

谷歌发布了Gemini 3.1 Flash Live，这是一款专为实时对话设计的AI音频模型，旨在降低延迟并产生更自然的语音节奏。该模型在复杂任务、推理和处理中断方面的基准测试中表现优异，使得AI语音更难以与人类区分。该模型已在部分谷歌产品中推出，并将供开发者构建对话式AI应用。

历史上，AI生成的文本和音频具有可识别的模式，能揭示其机器来源，但生成式AI的快速改进正使这些区别变得越来越微妙。实时对话式AI一直受限于延迟和不自然的语音节奏，影响了其在流畅类人交互中的可用性。