Robin's AI Lab

NVIDIA 驱动安装

检查驱动程序版本

要检查当前运行的驱动程序的版本：

bash

cat /proc/driver/nvidia/version

检查硬件的可用驱动程序

对于桌面：

bash

sudo ubuntu-drivers list

或者，对于服务器：

bash

sudo ubuntu-drivers list --gpgpu

您应该看到如下列表：

plaintext

nvidia-driver-470
nvidia-driver-470-server
nvidia-driver-535
nvidia-driver-535-open
nvidia-driver-535-server
nvidia-driver-535-server-open
nvidia-driver-550
nvidia-driver-550-open
nvidia-driver-550-server
nvidia-driver-550-server-open

安装通用驱动程序（例如台式机和游戏机）

您可以依赖自动检测，它将安装最适合您硬件的驱动程序：

bash

sudo ubuntu-drivers install

或者您可以告诉工具您想要安装哪个驱动程序。如果是这种情况，您将必须使用您在使用该命令时看到的ubuntu-drivers驱动程序版本（例如）。535``ubuntu-drivers list

假设我们要安装535驱动程序：

bash

sudo ubuntu-drivers install nvidia:535

在服务器上和/或出于计算目的安装驱动程序

您可以依赖自动检测，它将安装最适合您硬件的驱动程序：

bash

sudo ubuntu-drivers install --gpgpu

或者您可以告诉ubuntu-drivers工具您想要安装哪个驱动程序。如果是这种情况，您将必须使用驱动程序版本（例如535）和-server您在使用该ubuntu-drivers list --gpgpu命令时看到的后缀。

假设我们要安装535-server驱动程序（列为nvidia-driver-535-server）：

bash

sudo ubuntu-drivers install --gpgpu nvidia:535-server

您还需要安装以下附加组件：

bash

sudo apt install nvidia-utils-535-server

NVIDIA 驱动卸载

卸载驱动

shell

sudo apt-get --purge remove nvidia*
sudo apt-get --purge remove "*nvidia*"
sudo apt autoremove

To remove CUDA Toolkit:

shell

sudo apt-get --purge remove "*cublas*" "cuda*"

3.然后重装驱动

CUDAToolkit 安装

下载并安装 CUDA Toolkit

本机安装的 CUDA Toolkit 版本为 11.0.3，与上一步安装 CUDA 驱动 450 兼容（可以参考下载文件名的尾缀），具体下载命令，如下

shell

wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3_450.51.06_linux.run

安装命令，如下

shell

sudo sh cuda_11.0.3_450.51.06_linux.run

安装结束后，添加环境变量到 ~/.bashrc 文件的末尾，具体添加内容如下：

shell

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

保存后退出。

在 Terminal 中，激活环境变量命令为 source ~/.bashrc 。

测试 CUDA Toolkit 。通过编译自带 Samples并执行，以验证是否安装成功。具体命令如下所示：

shell

cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

如果安装成功，则输出类似于如下信息：

shell

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce RTX 2070 with Max-Q Design"
  CUDA Driver Version / Runtime Version          11.0 / 11.0
  CUDA Capability Major/Minor version number:    7.5
  Total amount of global memory:                 7982 MBytes (8370061312 bytes)
  (36) Multiprocessors, ( 64) CUDA Cores/MP:     2304 CUDA Cores
  GPU Max Clock rate:                            1125 MHz (1.12 GHz)
  Memory Clock rate:                             5501 Mhz
  Memory Bus Width:                              256-bit
  L2 Cache Size:                                 4194304 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  1024
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 3 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device supports Managed Memory:                Yes
  Device supports Compute Preemption:            Yes
  Supports Cooperative Kernel Launch:            Yes
  Supports MultiDevice Co-op Kernel Launch:      Yes
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 11.0, CUDA Runtime Version = 11.0, NumDevs = 1
Result = PASS

CUDNN 安装

Unzip the cuDNN package.

shell

tar -xvf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz

Copy the following files into the CUDA toolkit directory.

shell

sudo cp cudnn-linux-x86_64-8.6.0.163_cuda11-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cudnn-linux-x86_64-8.6.0.163_cuda11-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

PIP 换源

国内的镜像源

阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/

修改源方法：

临时使用：

Linux Mac Windows 通用命令

可以在使用pip的时候在后面加上-i参数，指定pip源

pip install scrapy -i https://pypi.tuna.tsinghua.edu.cn/simple

永久修改：

Linux:

修改 pip.conf 文件 (没有就创建一个)

$HOME/.config/pip/pip.conf

修改内容如下：

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple

或者直接使用下面的命令：

shell

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

PIP 导出所有包

若要与其他人共享项目、使用生成系统，或打算将项目复制到需要在其中还原环境的其他任何位置，必须指定项目需要的外部包。建议的方法是使用 requirements.txt 文件 (readthedocs.org)，文件中包含安装相关包所需版本的 pip 命令列表。最常见的命令是 pip freeze > requirements.txt，它将环境的当前包列表记录到 requirements.txt 中。

shell

pip freeze > requirements.txt

Conda 源加速

参考资料：https://www.cnblogs.com/VVingerfly/p/12046586.html

在linux系统下，conda的配置文件存储在~/.condarc中，将下面的配置文件粘贴到配置文件中即可获得一个满速的conda install体验：

shell

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

SSH 免密登录

1.客户端生成公私钥

本地客户端生成公私钥：（一路回车默认即可）

ssh-keygen

上面这个命令会在用户目录 .ssh 文件夹下创建公私钥,

cd ~/.ssh

文件夹下 .ssh 创建两个密钥：

id_rsa （私钥）

id_rsa.pub (公钥)

2.上传公钥到服务器

这里测试用的服务器地址为：192.168.235.22 用户为：root

shell

ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.235.22

上面这条命令是写到服务器上的 ssh 目录下去了

shell

cd ~/.ssh

shell

vim authorized_keys

可以看到客户端写入到服务器的 id_rsa.pub （公钥）内容。

3.测试免密登录

客户端通过ssh连接远程服务器，就可以免密登录了。

shell

ssh root@192.168.235.22

Linux 安装(升级) cmake

第一种方法（不推荐）

直接使用apt安装，但是安装的版本很老，不推荐这种方法

bash

sudo apt install cmake

第二种方法（cmake源码编译）

从https://cmake.org/download/下载源码，如cmake-3.24.1.tar.gz 解压包

tar -zxvf cmake-3.24.1.tar.gz

进入到解压后的文件夹，然后执行bootstrap文件进行检查

shell

cd cmake-3.24.1
./bootstrap

检查没有发现问题的话，进行安装 -j8是选择八核编译，如果是电脑是四核就make -j4，不清楚的就直接make，影响不大，只是编译速度的变化

make -j8
sudo make install

查看cmake版本 cmake --version

查看cmake路径 which cmake

如果成功输入版本信息，则编译安装成功.

第三种方法（ppa安装，推荐！）

添加签名密钥

shell

wget -O - https://apt.kitware.com/keys/kitware-archive-latest.asc 2>/dev/null | sudo apt-key add -

将存储库添加到您的源列表并进行更新

shell

sudo apt-add-repository 'deb https://apt.kitware.com/ubuntu/ bionic main'
sudo apt-get update

稳定版

shell

sudo apt-add-repository 'deb https://apt.kitware.com/ubuntu/ bionic main'
sudo apt-get update

候选发布版本

shell

sudo apt-add-repository 'deb https://apt.kitware.com/ubuntu/ bionic-rc main'
sudo apt-get update

然后再使用apt安装就是最新版本的cmak.

shell

sudo apt install cmake

Linux 安装(升级) gcc

步骤 1：安装 GCC 之前更新 Ubuntu

在开始之前，请更新系统以确保所有现有软件包都是最新的，以避免安装过程中出现任何冲突。

bash

sudo apt update
sudo apt upgrade

步骤2：选择GCC安装方法

方法 1：使用 Ubuntu 存储库安装 GCC

安装 GCC 的第一个推荐选项是直接安装 GCC 软件包，或者安装包含 GCC 和许多其他基本开发工具（例如 make、g++ 和 dpkg-dev）的 build-essential 软件包。

要开始安装，请使用以下命令。

bash

sudo apt install gcc

或者

bash

sudo apt install build-essential

安装后，验证安装并使用以下命令检查版本。

bash

gcc --version

方法2：通过工具链PPA在Ubuntu上安装GCC

以下方法将安装最新的 GCC 编译器或您可以从Ubuntu 工具链 PPA中寻找的替代版本。要导入此 PPA，请运行以下命令：

bash

sudo add-apt-repository ppa:ubuntu-toolchain-r/ppa -y

导入 PPA 后，更新 Ubuntu 源列表以反映通过在终端中运行以下命令所做的更改：

bash

sudo apt update

要使用 Ubuntu ToolChain PPA 在 Ubuntu 系统上安装特定版本的 GCC 编译器，请在终端中使用以下命令：

GCC 编译器 13

bash

sudo apt install g++-13 gcc-13

GCC 编译器 12

bash

sudo apt install g++-12 gcc-12

配置 GCC 的替代版本

作为开发人员或特定用户，您可能需要安装多个 GCC 编译器版本。请按照以下步骤在 Ubuntu 系统上配置 GCC 的替代版本。

首先，安装您需要的 GCC 版本。您可以使用以下命令安装多个版本的 GCC 和 G++：

bash

sudo apt install gcc-9 g++-9 gcc-10 g++-10 gcc-11 g++-11 g++-12 gcc-12 g++-13 gcc-13

安装必要的版本后，请使用 update-alternatives 命令配置每个版本的优先级。以下示例命令设置 GCC 9、GCC 10、GCC 11 和最新的 GCC 12 之间的优先级划分。

bash

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-13 100 --slave /usr/bin/g++ g++ /usr/bin/g++-13 --slave /usr/bin/gcov gcov /usr/bin/gcov-13

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 90 --slave /usr/bin/g++ g++ /usr/bin/g++-12 --slave /usr/bin/gcov gcov /usr/bin/gcov-12

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 80 --slave /usr/bin/g++ g++ /usr/bin/g++-11 --slave /usr/bin/gcov gcov /usr/bin/gcov-11

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-10 60 --slave /usr/bin/g++ g++ /usr/bin/g++-10 --slave /usr/bin/gcov gcov /usr/bin/gcov-10

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 40 --slave /usr/bin/g++ g++ /usr/bin/g++-9 --slave /usr/bin/gcov gcov /usr/bin/gcov-9

上述命令将 GCC 13 设置为最高优先级，值为 100，您可以根据自己的喜好配置优先级.

要确认 GCC 13 是系统上的默认版本，请运行以下命令：

bash

gcc --version

您可以使用 update-alternatives 命令重新配置系统上的默认 GCC 版本。首先，使用以下命令列出您之前设置的优先级：

bash

sudo update-alternatives --config gcc

输出示例：

shell

There are 5 choices for the alternative gcc (providing /usr/bin/gcc).

  Selection    Path             Priority   Status
------------------------------------------------------------
* 0            /usr/bin/gcc-11   100       auto mode
  1            /usr/bin/gcc-10   80        manual mode
  2            /usr/bin/gcc-11   100       manual mode
  3            /usr/bin/gcc-13   90        manual mode
  4            /usr/bin/gcc-7    80        manual mode
  5            /usr/bin/gcc-9    40        manual mode

Press <enter> to keep the current choice[*], or type selection number:

NVIDIA 驱动安装 ​

检查驱动程序版本 ​

推荐方式（ubuntu-drivers 工具） ​

检查硬件的可用驱动程序 ​

安装通用驱动程序（例如台式机和游戏机） ​

在服务器上和/或出于计算目的安装驱动程序 ​

NVIDIA 驱动卸载 ​

CUDAToolkit 安装 ​

下载并安装 CUDA Toolkit ​

CUDNN 安装 ​

PIP 换源 ​

国内的镜像源 ​

修改源方法： ​

临时使用： ​

永久修改： ​

PIP 导出所有包 ​

Conda 源加速 ​

SSH 免密登录 ​

1.客户端生成公私钥 ​

2.上传公钥到服务器 ​

3.测试免密登录 ​

Linux 安装(升级) cmake ​

第一种方法（不推荐） ​

第二种方法（cmake源码编译） ​

第三种方法（ppa安装，推荐！） ​

Linux 安装(升级) gcc ​

步骤 1：安装 GCC 之前更新 Ubuntu ​

步骤2：选择GCC安装方法 ​

方法 1：使用 Ubuntu 存储库安装 GCC ​

方法2：通过工具链PPA在Ubuntu上安装GCC ​

配置 GCC 的替代版本 ​

NVIDIA 驱动安装

检查驱动程序版本

推荐方式（ubuntu-drivers 工具）

检查硬件的可用驱动程序

安装通用驱动程序（例如台式机和游戏机）

在服务器上和/或出于计算目的安装驱动程序

NVIDIA 驱动卸载

CUDAToolkit 安装

下载并安装 CUDA Toolkit

CUDNN 安装

PIP 换源

国内的镜像源

修改源方法：

临时使用：

永久修改：

PIP 导出所有包

Conda 源加速

SSH 免密登录

1.客户端生成公私钥

2.上传公钥到服务器

3.测试免密登录

Linux 安装(升级) cmake

第一种方法（不推荐）

第二种方法（cmake源码编译）

第三种方法（ppa安装，推荐！）

Linux 安装(升级) gcc

步骤 1：安装 GCC 之前更新 Ubuntu

步骤2：选择GCC安装方法

方法 1：使用 Ubuntu 存储库安装 GCC

方法2：通过工具链PPA在Ubuntu上安装GCC

配置 GCC 的替代版本