ubantu安装pytorch避坑不完全指南

Ubantu配置pytorch

分享个人在安装pytorch中遇到的一些问题及解决办法。

1.安装ubantu双系统系统

为了使用显卡加速,需要安装双系统,因为虚拟机不支持显卡。安装推荐使用双硬盘。
如果配置环境出现难以定位或修改的问题,需要重装双系统里ubantu系统的,参考:
win10+ubuntu16.04双系统下完全删除并重装ubuntu16.04
之前没有安装过双系统的直接跳到此教程的第3步。
需要注意的几点:

  1. 重装时需要彻底删除ubantuefi分区及启动项;
  2. 在教程中ubantu的efi分区和win10的c盘为一个disk硬盘(如disk0),而ubantu一般在另一个disk硬盘(disk1);
  3. 在为ubantu分区时,尽量单独分给usr/local一个较大的空间,一般100G以上,默认情况下分配的此目录可能空间不够,这个目录是安装软件的默认目录(这点上踩过坑);
  4. 安装ubantu20时,由boot进入的gnu grub界面没有install ubantu选项,直接选择ubantu选项即可;
  5. 如果安装完双系统发现没有ubantu的选项,
    方法一:可以在每次开机后进入boot手动选择ubantu系统开机(以微星主板为例,bios为DEL,boot为F11);
    方法二:或者进入bios设置默认启动项为ubantu(此后每次开机会进入gnu grub界面,可以选择win10或者ubantu),默认启动项为win10时不会出现ubantu选项。

2.安装Nvdia驱动、CUDA 、CUDNN

由于ubantu自带nvdia驱动,但又不是完整,需要重新安装,参考:
Ubuntu18.04下安装Pytorch-GPU(超详细自己安装全过程)

需要注意的几点:

  1. 安装cuda时可以不安装依赖库;
  2. CUDA的版本一定要和CUDNN的版本对应,必须是CUDNN支持的版本;
  3. 第三个选项问是否安装NVIDIA Accelerated Graphics Driver驱动,选否;
  4. 如果出现Ensure there is enough space in /tmp and that the installation package is not corrupt报错,参考:【cuda安装】Ensure there is enough space in /tmp and that the installation package is not corrupt
    这个问题可能在安装cuda中出现,也可能在安装pytorch中出现。思路是一样的,都是临时更改temp文件路径,网上的一些教程命令不管用,亲测以上教程管用。
  5. 下载pytorch慢、更改镜像源也没用的,可以用pip指令安装,以11.3为例:
pip3 install torch==1.10.1+cu113 torchvision==0.11.2+cu113 torchaudio==0.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html

安装后出现Please make sure that

  • PATH includes /usr/local/cuda-11.1/bin
  • LD_LIBRARY_PATH includes /usr/local/cuda-11.1/lib64, or, add /usr/local/cuda-11.1/lib64 to /etc/ld.so.conf and run ldconfig as root
    只需要更新环境变量就行。
source ~/.bashrc

3.检查安装是否成功

 CUDA 版本
cat /usr/local/cuda/version.txt
 cuDNN 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

新版本查看cudnn命令已经更改,NVIDIA把版本信息换到cudnn_version.h中了,因此使用以下命令查看cudnn版本信息:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2没反应解决办法

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

猜你喜欢

转载自blog.csdn.net/xxc97/article/details/122028071