换了4090显卡和新的固态硬盘,重装深度学习环境,记录一下。
1. 检查显卡驱动是否安装
nvidia-smi
我安装的是最新的550,一般是可以兼容旧版本的,用的比较多的稳定版本是525
2. 安装CUDA
https://developer.nvidia.com/cuda-11-6-0-download-archive
wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
sudo sh cuda_11.6.0_510.39.01_linux.run
安装的时候:
1 Do you accept the above EULA? - accept
2 取消勾选Driver,因为我们已经安装了550
3 install

4 安装完添加路径
sudo gedit ~/.bashrc
在最后添加:
export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
别忘了更新
source ~/.bashrc
检查一下
nvcc --version
** Ubuntu 22.04 CUDA11.6 OK
3. 安装cuDNN(非必须)
cuDNN 9.1.0 Downloads | NVIDIA Developer
按照网站的命令行写就行了
4. 安装pytorch
Previous PyTorch Versions | PyTorch
对应版本参考:PyTorch中torch、torchvision、torchaudio、torchtext版本对应关系_torch2.0.1对应的torchvision-CSDN博客
conda install pytorch==1.12.0 torchvision==0.13.0 cudatoolkit=11.8 -c pytorch
上面这个是cpu版本的,不能下!!torch识别不出来!
下载下面cuda版本的:
pip install torch==1.12.0+cu116 torchvision==0.13.0+cu116 torchaudio==0.12.0 --extra-index-url https://download.pytorch.org/whl/cu116
安装好之后,验证一下:
python
import torch, torchvision
print(torch.cuda.is_available())
print(torch.__version__)
print()
print(torch.version.cuda)
from torch.backends import cudnn
print(cudnn.is_available())
print(torch.backends.cudnn.version())
cr:https://blog.csdn.net/u010422712/article/details/126444478
遗留问题:
1 cuda11.8可以兼容cuda11.6的torch吗?A:最好不要,后面似乎有不兼容的情况,我先安装的11.8后来换回11.6了
2 cuDNN为什么没用自己安装的9.1.0版本