爱沙尼亚语言研究所开发了一个'反宣传'基准,用于评估大型语言模型抵抗俄罗斯宣传叙事的能力。该研究在14个俄罗斯影响力操作类别中测试了各种LLM,其中Anthropic的Claude模型在专有模型中表现最佳。该基准评估模型在没有外部帮助的情况下抵制宣传的能力,使用英语、爱沙尼亚语和俄语的问题。
背景
随着AI语言模型在信息消费中变得越来越普遍,人们越来越担心它们容易受到国家支持的错误信息活动的影响。爱沙尼亚有着苏联占领的历史,目前与俄罗斯存在地缘政治紧张关系,因此特别关注开发工具来应对外国影响力操作。
- 来源
- Ars Technica
- 发布时间
- 2026年6月5日 04:44
- 评分
- 7.0 / 10