LLM架构图库

Lobsters

SEsebastianraschka.com via refi64

2026年3月16日 12:076.0/10

Sebastian Raschka创建了一个LLM架构图库，收录了从GPT-2到Llama 3、OLMo 2等主要语言模型的详细架构图和参数表。该图库通过可视化方式比较不同模型的解码器架构、注意力机制和归一化技术，为研究人员提供有价值的参考资源。同时提供高分辨率数字版本和实体海报两种形式。

自GPT-2以来，大语言模型在注意力机制、归一化技术和解码器设计等方面经历了显著演进。研究人员需要清晰的视觉参考来理解不同模型家族之间的技术差异。