Anthropic 的 Project Glasswing——将 Claude Mythos 限制给安全研究人员——我认为是必要的

Simon Willison2026年4月8日 04:528.0/10

Anthropic 通过 Project Glasswing 将其强大的新 AI 模型 Claude Mythos 限制仅供安全研究人员使用，因其具有前所未有的网络安全能力。该模型已发现数千个高危漏洞，包括复杂的漏洞利用链。这种受控发布旨在让行业有时间在能力扩散前准备防御措施。

AI 模型识别和利用软件漏洞的能力日益增强，引发了关于负责任部署的担忧。Anthropic 遵循与其他 AI 安全倡议类似的谨慎发布模式。