Skip to content

Main Navigation 首页

大语言模型

大规模并行

主题切换

Sidebar Navigation

概述

ChatGPT

ChatGPT 技术原理

常用 Prompt 模板

聊天模板指南

预训练

注意力机制：MHA、MQA 与 GQA

MLA

MoE 图解指南

位置编码

旋转位置编码

微调

LLM 微调方法

LoRA

工具链

HuggingFace 模型下载

HuggingFace 模型上传

文章目录

大语言模型

本板块聚焦大语言模型（Large Language Model，LLM）相关技术，涵盖预训练核心架构、微调方法论以及实用工具指南。

1. ChatGPT

ChatGPT 的技术原理与 RLHF
常用 ChatGPT Prompt 模板
文本大语言模型的聊天模板入门指南

2. 预训练

Transformer 注意力机制：MHA、MQA 与 GQA
多头潜在注意力（MLA）
图解混合专家模型（MoE）
Transformer 中的位置编码
旋转式位置编码（RoPE）

3. 微调

大型语言模型微调方法
低秩适配（LoRA）微调

4. 工具链

Hugging Face 模型下载指南
Hugging Face 模型上传指南

在 GitHub 上编辑此页

最后更新于:

Pager

下一篇ChatGPT 技术原理

Maintained by Robin

© 2017 — 2026. Powered by VitePress