Ubantu配置pytorch
分享个人在安装pytorch中遇到的一些问题及解决办法。
1.安装ubantu双系统系统
为了使用显卡加速,需要安装双系统,因为虚拟机不支持显卡。安装推荐使用双硬盘。
如果配置环境出现难以定位或修改的问题,需要重装双系统里ubantu系统的,参考:
win10+ubuntu16.04双系统下完全删除并重装ubuntu16.04
之前没有安装过双系统的直接跳到此教程的第3步。
需要注意的几点:
- 重装时需要彻底删除ubantuefi分区及启动项;
- 在教程中ubantu的efi分区和win10的c盘为一个disk硬盘(如disk0),而ubantu一般在另一个disk硬盘(disk1);
- 在为ubantu分区时,尽量单独分给usr/local一个较大的空间,一般100G以上,默认情况下分配的此目录可能空间不够,这个目录是安装软件的默认目录(这点上踩过坑);
- 安装ubantu20时,由boot进入的gnu grub界面没有install ubantu选项,直接选择ubantu选项即可;
- 如果安装完双系统发现没有ubantu的选项,
方法一:可以在每次开机后进入boot手动选择ubantu系统开机(以微星主板为例,bios为DEL,boot为F11);
方法二:或者进入bios设置默认启动项为ubantu(此后每次开机会进入gnu grub界面,可以选择win10或者ubantu),默认启动项为win10时不会出现ubantu选项。
2.安装Nvdia驱动、CUDA 、CUDNN
由于ubantu自带nvdia驱动,但又不是完整,需要重新安装,参考:
Ubuntu18.04下安装Pytorch-GPU(超详细自己安装全过程)
需要注意的几点:
- 安装cuda时可以不安装依赖库;
- CUDA的版本一定要和CUDNN的版本对应,必须是CUDNN支持的版本;
- 第三个选项问是否安装NVIDIA Accelerated Graphics Driver驱动,选否;
- 如果出现Ensure there is enough space in /tmp and that the installation package is not corrupt报错,参考:【cuda安装】Ensure there is enough space in /tmp and that the installation package is not corrupt
这个问题可能在安装cuda中出现,也可能在安装pytorch中出现。思路是一样的,都是临时更改temp文件路径,网上的一些教程命令不管用,亲测以上教程管用。 - 下载pytorch慢、更改镜像源也没用的,可以用pip指令安装,以11.3为例:
pip3 install torch==1.10.1+cu113 torchvision==0.11.2+cu113 torchaudio==0.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
安装后出现Please make sure that
- PATH includes /usr/local/cuda-11.1/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-11.1/lib64, or, add /usr/local/cuda-11.1/lib64 to /etc/ld.so.conf and run ldconfig as root
只需要更新环境变量就行。
source ~/.bashrc
3.检查安装是否成功
CUDA 版本
cat /usr/local/cuda/version.txt
cuDNN 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
新版本查看cudnn命令已经更改,NVIDIA把版本信息换到cudnn_version.h中了,因此使用以下命令查看cudnn版本信息:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2没反应解决办法
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2