英国政府AI安全研究所评估了Anthropic的Mythos Preview模型,发现其在单个网络安全任务上与其他前沿模型相似,但在串联多步骤复杂攻击方面表现突出。该模型完成了超过85%的基础'学徒级'夺旗挑战,与GPT-5.4等竞争对手相当。这项独立评估为AI网络安全能力提供了超越厂商声明的关键验证。
背景
AI安全研究所(AISI)是英国政府机构,自2023年起通过夺旗挑战测试AI模型的网络安全能力。Anthropic最近因其先进的安全能力限制了Mythos Preview模型的访问。
- 来源
- Ars Technica
- 发布时间
- 2026年4月15日 03:11
- 评分
- 7.0 / 10