2000人试图黑客我的AI助手后发生了什么

Simon Willison2026年6月27日 02:337.0/10

一项针对OpenClaw AI实例的提示注入挑战中，2000名参与者进行了6000次尝试，但未能泄露任何秘密。这一结果突显了前沿模型在抵抗提示注入攻击方面的有效性，尽管专家警告绝对安全仍无法保证。

提示注入仍是LLM部署中的重大安全隐患，恶意输入可能操纵模型行为。近期在模型训练方面的进步，如Opus 4.6和GPT-5.6中所见，旨在通过强大的防注入协议来减轻这些风险。