E-Ink 新闻日报

返回列表

英国政府Mythos AI测试帮助区分网络安全威胁与炒作

英国政府AI安全研究所评估了Anthropic的Mythos Preview模型,发现其在单个网络安全任务上与其他前沿模型相似,但在串联多步骤复杂攻击方面表现突出。该模型完成了超过85%的基础'学徒级'夺旗挑战,与GPT-5.4等竞争对手相当。这项独立评估为AI网络安全能力提供了超越厂商声明的关键验证。

背景

AI安全研究所(AISI)是英国政府机构,自2023年起通过夺旗挑战测试AI模型的网络安全能力。Anthropic最近因其先进的安全能力限制了Mythos Preview模型的访问。

来源
Ars Technica
发布时间
2026年4月15日 03:11
评分
7.0 / 10