GPT-5.5在网络安全测试中与备受炒作的Mythos Preview表现相当

Ars Technica

Kyle Orland

2026年5月1日 23:327.0/10

英国AI安全研究所的新研究表明，OpenAI的GPT-5.5在网络安全能力上与Anthropic严格限制的Mythos Preview模型表现相当，在专家级CTF挑战和复杂攻击模拟中取得相似结果。两款模型在以往AI系统失败的测试中均取得成功，但都未能通过最困难的电厂控制系统测试。这些发现表明Anthropic对Mythos的限制发布策略可能更多是营销手段而非基于独特能力。

背景

Anthropic最近以特殊网络安全风险为由限制其Mythos Preview模型的访问，而OpenAI则公开发布了GPT-5.5。英国AI安全研究所使用夺旗挑战和攻击模拟对AI模型的网络安全能力进行标准化测试。

来源: Ars Technica
发布时间: 2026年5月1日 23:32
评分: 7.0 / 10

阅读原文 →