-
查看显卡信息
# 查看驱动版本 drive version nvidia-smi # 定时刷新(每隔2秒刷新一次,每次只在固定位置刷新) watch -n 2 -d nvidia-smi # 定时查询(每隔2秒查询一下,但是每次的查询结果会接着上一个往下刷新,导致持续扩张terminal的历史log) nvidia-smi -l 2
-
nvidia 驱动安装
-
方式1
-
点击下载驱动 .run
-
赋执行权限
chmod +x NVIDIA-Linux-x86_64-550.40.07.run
-
运行安装:
./NVIDIA-Linux-x86_64-550.40.07.run
-
验证是否安装
nvidia-smi
-
方式2
-
卸载从文件安装的 NVIDIA 驱动程序或 CUDA 工具包的捆绑驱动程序
.run
sudo apt clean sudo apt update sudo apt purge nvidia-* sudo apt autoremove ./NVIDIA-Linux-x86_64-550.40.07.run --uninstall
-
从 PPA 安装 NVIDIA 驱动程序
- 添加 PPA :
graphics-drivers
sudo add-apt-repository ppa:graphics-drivers/ppa --yes sudo apt update
- 添加 PPA :
-
从 PPA 安装 NVIDIA 驱动程序:
sudo apt install nvidia-driver-550 # or nvidia-driver-550
-
(可选)将驱动程序标记为保留以防止自动升级(因为它是服务器)
dpkg-query -W --showformat='${Package} ${Status}\n' | grep -v deinstall | awk '{ print $1 }' | \ grep -E 'nvidia.*-[0-9]+$' | \ xargs -r -L 1 sudo apt-mark hold
-
-
cuda toolkit
- 为创建高性能、GPU 加速的应用程序提供了开发环境
-
sudo apt install nvidia-cuda-toolkit
-
cuda
-
NVIDIA 专为图形处理单元 (GPU) 上的通用计算开发的并行计算平台和编程模型,借助 CUDA,开发者能够利用 GPU 的强大性能显著加速计算应用
-
下载 .run文件
-
运行安装,如果没有drive驱动,可以选择驱动一起安装
-
配置环境变量
cuda-11.8 为安装的版本号
export PATH="/usr/local/cuda-11.8/bin:$PATH" export LD_LIBRARY_PATH="/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH"
-
查看运行时版本 runtime version
nvcc --version
-
-
cuDNN 是用于深度神经网络的 GPU 加速基元库
-
dpkg安装:
dpkg -i cudnn-local-repo-ubuntu2004-8.9.7.29_1.0-1_amd64.deb
-
根据提示 安装GPT秘钥
sudo cp /var/cudnn-local-repo-ubuntu2004-8.9.7.29/cudnn-local-CD2C2DD4-keyring.gpg /usr/share/keyrings/
-
sudo apt-get update
-
sudo apt-get install libcudnn8
-
安装完成,测试
dpkg -l | grep libcudnn
参考
问题
-
CUDA 问题解决 —nvcc -V bash: /usr/bin/nvcc: No such file or directory
export PATH=/usr/local/cuda-12.3/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-12.3/lib64:$LD_LIBRARY_PA
-
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
文章评论