谷歌推出了Gemma 4 12B,这是一个无需单独编码器的统一多模态AI模型,能够同时处理文本和图像。该模型在各种基准测试中表现出色,同时比之前的架构更高效。这一发布代表了多模态AI能力的重大进步,可能会影响未来的模型设计。
背景
传统上,能够同时处理文本和图像的多模态AI模型需要为不同模态使用单独的编码器。谷歌的Gemma 4 12B引入了一种新颖的统一架构,无需单独的编码器,这可能会提高效率和性能。
- 来源
- Hacker News (RSS)
- 发布时间
- 2026年6月4日 00:04
- 评分
- 8.0 / 10