英国政府Mythos AI测试帮助区分网络安全威胁与炒作

Ars Technica

Kyle Orland

2026年4月15日 03:117.0/10

英国政府AI安全研究所评估了Anthropic的Mythos Preview模型，发现其在单个网络安全任务上与其他前沿模型相似，但在串联多步骤复杂攻击方面表现突出。该模型完成了超过85%的基础'学徒级'夺旗挑战，与GPT-5.4等竞争对手相当。这项独立评估为AI网络安全能力提供了超越厂商声明的关键验证。

背景

AI安全研究所(AISI)是英国政府机构，自2023年起通过夺旗挑战测试AI模型的网络安全能力。Anthropic最近因其先进的安全能力限制了Mythos Preview模型的访问。

来源: Ars Technica
发布时间: 2026年4月15日 03:11
评分: 7.0 / 10

阅读原文 →