E-Ink 新闻日报

返回列表

性格冲突导致Anthropic模型下线

据报道,性格冲突导致美国政府决定让Anthropic的AI模型下线,关键高管正在与商务部会面。这一情况凸显了AI安全方面的持续挑战以及创建防越狱模型的困难。文章质疑Anthropic是否充分解决了其系统面临的已知对抗性攻击问题。

背景

Anthropic是一家AI研究公司,开发了Claude等大型语言模型,专注于AI安全和一致性。该公司一直在研究宪法AI方法,以使模型更能抵御对抗性攻击。

来源
Simon Willison
发布时间
2026年6月15日 22:57
评分
7.0 / 10