Anthropic 通过 Project Glasswing 将其强大的新 AI 模型 Claude Mythos 限制仅供安全研究人员使用,因其具有前所未有的网络安全能力。该模型已发现数千个高危漏洞,包括复杂的漏洞利用链。这种受控发布旨在让行业有时间在能力扩散前准备防御措施。
背景
AI 模型识别和利用软件漏洞的能力日益增强,引发了关于负责任部署的担忧。Anthropic 遵循与其他 AI 安全倡议类似的谨慎发布模式。
- 来源
- Simon Willison
- 发布时间
- 2026年4月8日 04:52
- 评分
- 8.0 / 10