E-Ink 新闻日报

返回列表

GPT-5.5在网络安全测试中与备受炒作的Mythos Preview表现相当

英国AI安全研究所的新研究表明,OpenAI的GPT-5.5在网络安全能力上与Anthropic严格限制的Mythos Preview模型表现相当,在专家级CTF挑战和复杂攻击模拟中取得相似结果。两款模型在以往AI系统失败的测试中均取得成功,但都未能通过最困难的电厂控制系统测试。这些发现表明Anthropic对Mythos的限制发布策略可能更多是营销手段而非基于独特能力。

背景

Anthropic最近以特殊网络安全风险为由限制其Mythos Preview模型的访问,而OpenAI则公开发布了GPT-5.5。英国AI安全研究所使用夺旗挑战和攻击模拟对AI模型的网络安全能力进行标准化测试。

来源
Ars Technica
发布时间
2026年5月1日 23:32
评分
7.0 / 10