微软推出了两款新的文本大语言模型:MAI-Thinking-1(350亿参数)用于推理任务,目前仅向部分合作伙伴开放;以及专为GitHub Copilot和VS Code优化的MAI-Code-1-Flash(50亿参数)。值得注意的是,这两款模型都使用了干净的商业授权数据进行训练,没有使用第三方蒸馏,这可能为AI开发中的数据授权设立新标准。较小的参数量表明微软正专注于提高效率和降低成本。
背景
大型语言模型在训练数据授权和版权方面面临越来越多的审查,许多模型使用网络抓取的数据进行训练,其合法性存疑。微软强调使用'干净且适当授权的数据',这代表了解决这些问题的重大转变。
- 来源
- Simon Willison
- 发布时间
- 2026年6月3日 06:21
- 评分
- 7.0 / 10