Simon Willison 分享了一个使用 Gemma 4 E2B 模型和 MLX 在 macOS 上转录音频文件的实用方法。该方法通过命令行工具实现,展示了合理的转录准确性,尽管存在少量错误。这为使用开源工具进行本地音频转文本实验提供了一种便捷途径。
背景
Gemma 是谷歌的开源语言模型系列,MLX 是苹果的机器学习框架,专为苹果芯片高效运行而设计。使用本地模型进行音频转录是边缘设备AI的一个新兴应用场景。
- 来源
- Simon Willison
- 发布时间
- 2026年4月13日 07:57
- 评分
- 5.0 / 10