这些LLM在抵抗俄罗斯宣传方面表现最佳

Ars Technica

Kyle Orland

2026年6月5日 04:447.0/10

爱沙尼亚语言研究所开发了一个'反宣传'基准，用于评估大型语言模型抵抗俄罗斯宣传叙事的能力。该研究在14个俄罗斯影响力操作类别中测试了各种LLM，其中Anthropic的Claude模型在专有模型中表现最佳。该基准评估模型在没有外部帮助的情况下抵制宣传的能力，使用英语、爱沙尼亚语和俄语的问题。

随着AI语言模型在信息消费中变得越来越普遍，人们越来越担心它们容易受到国家支持的错误信息活动的影响。爱沙尼亚有着苏联占领的历史，目前与俄罗斯存在地缘政治紧张关系，因此特别关注开发工具来应对外国影响力操作。