性格冲突导致Anthropic模型下线

Simon Willison2026年6月15日 22:577.0/10

据报道，性格冲突导致美国政府决定让Anthropic的AI模型下线，关键高管正在与商务部会面。这一情况凸显了AI安全方面的持续挑战以及创建防越狱模型的困难。文章质疑Anthropic是否充分解决了其系统面临的已知对抗性攻击问题。

Anthropic是一家AI研究公司，开发了Claude等大型语言模型，专注于AI安全和一致性。该公司一直在研究宪法AI方法，以使模型更能抵御对抗性攻击。