HuggingFace 模型下载指南

推荐 HuggingFace 镜像站：https://hf-mirror.com
推荐官方的 huggingface-cli 命令行工具
推荐本站开发的 hfd 脚本

Stack Overflow 上有一个 AI 开发入门的常见问题 How to download model from huggingface?，回答方式多种多样，可见下载 HuggingFace 模型的方法十分丰富。

在网络快速且稳定的环境下，任何方法均可满足需求。然而结合国内的网络环境，断点续传、多线程下载等特性十分必要，否则下载中断后需要重新开始，浪费大量时间。基于这一考虑，以下对各类方法做总结和排序：

方法类别		推荐程度	优点	缺点
基于 URL	浏览器网页下载	⭐⭐⭐	通用性好	手动麻烦/无多线程
基于 URL	多线程下载器	⭐⭐⭐⭐	通用性好	手动麻烦
CLI 工具	`git clone` 命令	⭐⭐	简单	无断点续传/冗余文件/无多线程
专用 CLI 工具	`huggingface-cli`+`hf_transfer`	⭐⭐⭐	官方下载工具链，功能最全	无进度条/容错性低
专用 CLI 工具	`huggingface-cli`	⭐⭐⭐⭐⭐	官方下载工具	不支持多线程
Python 方法	`snapshot_download`	⭐⭐⭐	官方支持，功能全	脚本复杂/无多线程
	`from_pretrained`	⭐	官方支持，简单	不方便存储，功能不全
	`hf_hub_download`	⭐	官方支持	不支持全量下载/无多线程

另外对于数据集的下载和模型基本相同，同理参考。

1. 浏览器网页下载

模型项目页的 Files 栏中可以获取文件的下载链接。直接网页复制下载链接，或用其他下载工具下载。

（图：示意图）

2. 多线程下载器

常规工具如浏览器默认采用单线程下载。由于国内网络运营商线路质量、QoS 等因素，有时候会很慢。多线程加速是一种有效、显著提高下载速度的方法。

经典多线程工具推荐两个：IDM、aria2。IDM 适用于 Windows，aria2 适用于 Linux。获取 URL 后，可以利用这些多线程工具来下载。以我的一次实测为例，单线程 700KB/s，IDM 8 线程 6MB/s。千兆宽带下，利用 IDM 能跑到 80MB/s+。

（图：示意图）

当然，手动获取仓库中所有 URL 并导入到多线程下载工具比较麻烦，因此我写了一个命令行脚本 hfd.sh（Gist 链接），结合自动获取 URL 以及 aria2 多线程下载，适合 Linux。具体原理见下一节。

2.1 安装 aria2

aria2 是一个命令行工具，允许通过各种协议下载文件，如 HTTP、HTTPS、FTP、SFTP、BitTorrent 和 Metalink。这个工具可以在下载中断的地方恢复下载。

本教程解释了如何在 Ubuntu 20.04 上安装 aria2。

确保软件包列表是最新的：

shell

sudo apt update

安装 aria2：

shell

sudo apt install -y aria2

安装完成后，aria2 将作为 aria2c 命令可用。检查版本：

shell

aria2c --version

2.2 专用多线程下载器 hfd

hfd 是基于 Git 和 aria2 实现的专用于 HuggingFace 下载的命令行脚本：hfd.sh（Gist 链接）。hfd 相比 huggingface-cli，鲁棒性更好，很少会有奇怪的报错，此外多线程控制力度也更细，可以设置线程数量。缺点是目前仅适用于 Linux 和 macOS。

其原理是

Step1：Git clone 项目仓库中 lfs 文件之外的所有文件，并自动获取 lfs 文件的 URL；
Step2：利用 aria2 多线程下载文件。

该工具同样支持设置镜像端点的环境变量：

bash

export HF_ENDPOINT="https://hf-mirror.com"

基本命令：

bash

bash hfd.sh bigscience/bloom-560m --tool aria2c -x 4

如果没有安装 aria2，则可以默认用 wget：

bash

bash hfd.sh bigscience/bloom-560m

下载需要登录的模型

首先登录 HuggingFace 网站，获取 token，然后

shell

hfd meta-llama/Llama-2-7b --hf_username YOUR_HF_USERNAME_NOT_EMAIL --hf_token YOUR_HF_TOKEN

下载模型时排除特定文件（如 .safetensors）：

shell

hfd bigscience/bloom-560m --exclude *.safetensors

3. Git clone

此外官方还提供了 git clone repo_url 的方式下载。这种方法相当简单，然而却是最不推荐直接用的方法，缺点有二：

1）不支持断点续传，断了重头再来；
2）clone 会下载历史版本占用磁盘空间。即使没有历史版本，.git 文件夹大小也会存储一份当前版本模型的拷贝以及元信息，导致整个模型文件夹磁盘占用两倍以上。对于有些存在历史版本的模型，下载时间两倍以上。对于网络不够稳、磁盘不够大的用户，严重不推荐！

（图：设置环境变量，Git 跳过 LFS 大文件）

一种比较好的实践是，设置 GIT_LFS_SKIP_SMUDGE=1 环境变量（这可能也是官方 HuggingFace 页面提到这个参数的原因），再 git clone。这样 Git 会先下载仓库中除了大文件之外的所有文件。然后再用支持断点续传的工具来下载大文件，这样既支持了断点续传，.git 目录也不会太大（一般几百 KB）。这整个流程，其实就是上一节提到的 hfd 脚本的实现逻辑，感兴趣的可以参考/使用。

4. huggingface-cli+hf_transfer

huggingface-cli 和 hf_transfer 是 HuggingFace 官方提供的专门为下载而设计的工具链。前者是一个命令行工具，后者是下载加速模块。

4.1 huggingface-cli

0 隶属于 huggingface_hub 库，不仅可以下载模型、数据，还可以登录 HuggingFace、上传模型、数据等。

安装依赖

bash

pip install -U huggingface_hub

注意：huggingface_hub 依赖于 Python >= 3.8，此外需要安装 0.17.0 及以上的版本，推荐 0.19.0+。

下载模型

bash

huggingface-cli download --resume-download bigscience/bloom-560m --local-dir bloom-560m

下载数据

bash

huggingface-cli download --resume-download --repo-type dataset lavita/medical-qa-shared-task-v1-toy

huggingface-cli 属于官方工具，长期支持肯定是最好的，非常推荐。

除了长期支持这个优点，官方工具最大的优点在于可以用模型名直接引用模型。

什么意思呢？我们知道，from_pretrained 函数可以接收一个模型的 id，也可以接收模型的存储路径。

假如我们用浏览器下载了一个模型，存储到服务器的 /data/gpt2 下了，调用的时候你得写模型的绝对路径

bash

AutoModelForCausalLM.from_pretrained("/data/gpt2")

然而如果你用的 huggingface-cli download gpt2 --local-dir /data/gpt2 下载，即使你把模型存储到了自己指定的目录，但是你仍然可以简单的用模型的名字来引用他。即：

bash

AutoModelForCausalLM.from_pretrained("gpt2")

原理是因为 HuggingFace 工具链会在 .cache/huggingface/ 下维护一份模型的符号链接。无论你是否指定了模型的存储路径，缓存目录下都会链接过去，这样可以避免忘了自己曾经下过某个模型，调用的时候也很方便。

所以用了官方工具，既可以方便的用模型名引用模型，又可以自己把模型集中存在一个自定义的路径，方便管理。

当然，该工具目前还是有一些缺点的：

一是其存储逻辑不太直观，其默认会把模型下载到 ~/.cache/huggingface/hub/ 中，即使设置了 --local-dir，也会采用符号链接的形式进行链接，其目的在于防止重复下载。然而我们有时候只想简单的下载到特定目录，其中有一项 --local-dir-use-symlinks，设置为 False 可以部分解决该问题，虽然仍会临时下载到 ~/.cache/huggingface/hub/，但下载完成后会移动到 --local-dir 指定的目录。

二是由于上述逻辑的问题，主动 Ctrl+C 中断后，断点续传有时存在 bug，导致同样的文件无法中断恢复，会重头下载。相信官方后续会改进。

三是不支持单文件多线程。目前的行为是多文件并行，一次性会同时下载多个文件。

四是遇到网络中断会报错退出，不会自动重试，需要重新手动执行。

4.2 hf_transfer

hf_transfer 依附并兼容 huggingface-cli，是 HuggingFace 官方专门为提高下载速度基于 Rust 开发的一个模块，开启后在带宽充足的机器上可以跑到 500MB/s。本人实测了三台不同网络环境的机器，确实有黑科技，都把带宽跑满了（千兆）。

然而缺点是：

1）没有进度条：是真的没有进度条，有进度条说明你没有开启成功。
2）鲁棒性差：遇到网络不稳定会报错，并提示用户考虑关闭该模块提高容错性。可能这个模块还不够成熟，对国内这种丢包率高的网络水土不服。

尽管如此，还是推荐给大家，看各自网络情况吧。

项目地址：https://github.com/huggingface/hf_transfer。

开启方法

(1)安装依赖

bash

pip install -U hf-transfer

(2)设置 HF_HUB_ENABLE_HF_TRANSFER 环境变量为 1

Linux

bash

export HF_HUB_ENABLE_HF_TRANSFER=1

Windows Powershell

bash

$env:HF_HUB_ENABLE_HF_TRANSFER = 1

开启后使用方法同 huggingface-cli：

bash

huggingface-cli download --resume-download bigscience/bloom-560m --local-dir bloom-560m

注意：如果看到进度条，说明 hf_transfer 没开启成功！例如以下情况：

--resume-download 参数，指的是从上一次下载的地方继续，一般推荐总是加上该参数，断了方便继续。然而如果你一开始没有开启 hf_transfer，下载中途停掉并设置环境变量开启，此时用 --resume-download 会由于不兼容导致 hf_transfer 开启失败！总之观察是否有进度条就可以知道有没有开启成功，没有进度条就说明开启成功！

5. snapshot_download

HuggingFace 官方提供了 0 方法下载完整模型，参数众多、比较完善。相比下文另两个 Python 方法，推荐 snapshot_download 来下载模型，支持断点续传、指定路径、配置代理、排除特定文件等功能。然而有两个缺点：

1）该方法依赖于 transformers 库，而这个库是个开发用的库，对于自动化运维有点重；
2）该方法调用比较复杂，参数较多。例如默认会检查用户缓存目录下是否已有对应模型，如已有则会创建符号链接，不理解的容易导致问题。加上需要配置代理，最佳实践的参数配置如下：

python

from huggingface_hub import snapshot_download

snapshot_download(
  repo_id="bigscience/bloom-560m",
  local_dir="/data/user/test",
  local_dir_use_symlinks=False,
  proxies={"https": "http://localhost:7890"}
)

对于需要登录的模型，还需要两行额外代码：

python

import huggingface_hub
huggingface_hub.login("HF_TOKEN") # token 从 https://huggingface.co/settings/tokens 获取

很难记住这么多代码。经常性要下载模型的，不如用上文介绍的官方命令行工具 huggingface-cli。

6. from_pretrained

不过多介绍了，常规方法。

python

import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

7. hf_hub_download

不过多介绍了，常规方法。

8. Q1：如何下载 HuggingFace 上需要登录的模型？

由于模型发布者的版权要求，部分模型无法公开访问下载，需要在 HuggingFace 上申请许可通过后才可下载。这类模型称为 Gated Model。基本步骤是：

1.申请许可
2.获取 Access Token（用于命令行和 Python 方法调用）
3.下载

8.1 申请许可

此步骤必须在 HuggingFace 官网注册登录后申请，由于网络安全原因，镜像站一般不支持。

（图：Gated Model 申请）

申请后一般等待几分钟到几天不等（通常几分钟即可），会发邮件通知审批结果。

8.2 获取 access token

申请通过后，就可以在模型主页的 Files and versions 中看到模型文件了，浏览器的话直接点击下载即可。但如果想用工具（如 huggingface-cli）下载，则需要获取 Access Token。

Access Token 获取地址：https://huggingface.co/settings/tokens

（图：示意图）

访问 HuggingFace 设置页面的 Token 管理页，选择 New 一个 token，只需要 Read 权限即可，创建后便可以在工具中使用了。

8.3 下载

除了登陆后浏览器直接下载，几种工具的使用方法分别介绍如下：

Git

bash

git clone https://hf_username:hf_token@huggingface.co/meta-llama/Llama-2-7b-chat-hf

huggingface-cli：添加 --token 参数

bash

huggingface-cli download --token hf_ --resume-download bigscience/bloom-560m --local-dir bloom-560m

curl、wget：在 header 中添加 token

bash

curl -L --header "Authorization: Bearer hf_" -o model-00001-of-00002.safetensors https://huggingface.co/meta-llama/Llama-2-7b-chat-hf/resolve/main/model-00001-of-00002.safetensors

bash

wget --header "Authorization: Bearer hf_" https://huggingface.co/meta-llama/Llama-2-7b-chat-hf/resolve/main/model-00001-of-00002.safetensors

snapshot_download：调用 login 方法

python

import huggingface_hub
huggingface_hub.login("hf_")

9. Q2：如何利用镜像站下载 HuggingFace 模型？

9.1 直接访问镜像站，获取文件 URL

镜像站 https://hf-mirror.com。

（图：示意图）

9.2 设置 HF_ENDPOINT 环境变量

适用于 HuggingFace 官方的工具和库，包括：

huggingface-cli
snapshot_download
from_pretrained
hf_hub_download
timm.create_model

设置方法

Windows Powershell

powershell

$env:HF_ENDPOINT = "https://hf-mirror.com"

Linux

bash

export HF_ENDPOINT="https://hf-mirror.com"

Python

python

import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

注意 os.environ 得在 import huggingface 库相关语句之前执行。

总结

以上，我们介绍了浏览器、多线程工具、Git clone、huggingface-cli、hf_transfer、Python 方法、hfd 脚本等众多方法，各自有其适用场景，大家根据自己的操作系统的支持情况以及个人习惯来选择。

个人推荐：

Linux/macOS/Windows 默认推荐使用 huggingface-cli，对外网连接较好（丢包少）时，可尝试 huggingface-cli+hf_transfer（可选）。
网络连接不好，考虑用多线程工具。Linux 推荐 aria2，Windows 推荐 IDM。
偶尔小文件下载，直接访问镜像站，用浏览器下载。
不推荐 Git clone（可以被 huggingface-cli 替代），但如确有需要，小模型、小数据集可以 Git clone，建议文件大不要直接 clone，设置环境变量 GIT_LFS_SKIP_SMUDGE=1 再 clone，大文件单独用别的工具下载。

最后，使用问题、建议和技术交流可加群。

参考

本文参考：https://padeoe.com/huggingface-large-models-downloader/

hfd tool：https://gist.github.com/padeoe/697678ab8e528b85a2a7bddafea1fa4f

HuggingFace 模型下载指南 ​

1. 浏览器网页下载 ​

2. 多线程下载器 ​

2.1 安装 aria2 ​

2.2 专用多线程下载器 hfd ​

3. Git clone ​

4. huggingface-cli+hf_transfer ​

4.1 huggingface-cli ​

4.2 hf_transfer ​

5. snapshot_download ​

6. from_pretrained ​

7. hf_hub_download ​

8. Q1：如何下载 HuggingFace 上需要登录的模型？ ​

8.1 申请许可 ​

8.2 获取 access token ​

8.3 下载 ​

9. Q2：如何利用镜像站下载 HuggingFace 模型？ ​

9.1 直接访问镜像站，获取文件 URL ​

9.2 设置 HF_ENDPOINT 环境变量 ​

总结 ​

参考 ​

HuggingFace 模型下载指南

1. 浏览器网页下载

2. 多线程下载器

2.1 安装 aria2

2.2 专用多线程下载器 hfd

3. Git clone

4. huggingface-cli+hf_transfer

4.1 huggingface-cli

4.2 hf_transfer

5. snapshot_download

6. from_pretrained

7. hf_hub_download

8. Q1：如何下载 HuggingFace 上需要登录的模型？

8.1 申请许可

8.2 获取 access token

8.3 下载

9. Q2：如何利用镜像站下载 HuggingFace 模型？

9.1 直接访问镜像站，获取文件 URL

9.2 设置 HF_ENDPOINT 环境变量

总结

参考