新电脑安装和配置pytorch、anaconda、CUDA、cuDNN、pycharm、OpenCV、matplotlib等必需软件的过程记录和踩坑纪实

显卡驱动和CUDA

一、升级显卡驱动到官方最新版


        1、打开英伟达官网,输入显卡芯片型号,手动搜索并下载显卡驱动。 NVIDIA 官方驱动 

        2、下载完成后安装驱动。 

二、确认显卡支持的最高CUDA版本


        1、键盘"win+R",调出运行输入cmd后点”确定“或回车,进入命令行模式
 

        2、在命令行窗口输入nvidia-smi,回车,出现下面的内容:

        第一行的CUDA Version:12.6,含义是本显卡支持的最高CUDA版本是12.6。


三、下载和安装CUDA Tookit 


        1、确定显卡算力,打开下面链接:CUDA GPU | NVIDIA 开发者

展开上面网页的对应自己显卡类别子链接,找到自己的显卡型号。



       我是2080Ti,对应的算力是7.5。
        2 、选择CUDA版本参照这篇: NVIDIA GPU的架构代号_kepler-CSDN博客

        我的显卡7.5算力,对应的CUDA是10以上,前面已知显卡支持的最高CUDA版本是12.6,所以选择范围为10.0-12.6。
        打开网址CUDA Toolkit Archive | NVIDIA Developer,本着不选过高和过低版本的原则,选择V11.6。

        3、点击下载解压缩和安装。

四、验证路径是否加入环境变量

打开 此电脑---->系统属性---->高级系统设置---->环境变量

在系统变量内有这两个路径即可。

五、验证CUDA安装

打开命令行窗口,输入nvcc -V,显示如下内容,即为安装成功。

cuDNN

一、下载

打开链接cuDNN 历史版本 | NVIDIA 开发者

选择适合的版本,下载解压后得到了四个文件夹和一个文件,如图:

二、复制

        打开CUDA的安装路径,将上面的四个文件夹内的文件复制到安装路径下同名文件夹内,即bin内的文件复制到安装路径bin,include内的文件复制到安装路径include,lib内的文件复制到安装路径lib,单独的LICENSE文件复制到CUDA的安装路径文件夹内,我的路径是这个:

三、验证

         首先打开CUDA安装路径下的\extras\demo_suite文件夹,如图:

        在地址栏单击鼠标左键,输入cmd回车,打开命令行窗口,显示如下:

 输入bandwidthTest.exe,回车,显示如下

 输入deviceQuery.exe ,回车,显示如下

以上均显示Result = PASS,则为cuDNN安装成功。

anaconda

一、下载

Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

这里选择了2022-10 的版本。

二、安装

 

 

 一路next直到开始安装。

出现了这个把勾去掉:

三、修改环境变量

 

 双击打开系统变量的path,新建以下路径:

注意,新建的时候把路径换为你安装的anaconda的实际路径。

四、验证安装

打开命令行窗口,输入conda --version回车,出现下面内容,安装成功。

 PyTorch

一、下载文件:

1、获取本机的python和CUDA以及cuDNN版本:

在命令行窗口输入python,会显示python的版本,我的是3.9:

 在命令行窗口输入nvcc -V,会显示已安装的CUDA的版本,我的是11.6:

 用记事本打开CUDA安装路径下的\vxx.x\include下的cudnn_version.h,我的路径是这个:

 找到下面几行字:

 8.9.7就是cuDNN的版本,我们只需要知道第一位数字8就够用了。

所以我应该下载的torch版本是:python3.9,CUDA11.6,cuDNN8.0:

 2、下载文件

打开链接

Index of /anaconda/cloud/pytorch/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

 我的系统是win64,所以继续点击win-64,出现下面内容:

根据本机的python和CUDA以及cuDNN版本选择pytorch版本下载。

 

下载完毕后保存在本地文件夹,不用解压缩。 

 3、在anaconda内创建虚拟环境并安装pytorch

        新建或者克隆base虚拟环境,如果用新建虚拟环境,则新环境只包含几个常用的包,优点是占用空间小,缺点是很多常用的功能包,比如numpy、pandas等都需要重新再一个一个手动安装。克隆base虚拟环境的方法,新环境里包含了base包里的所有功能包,缺点是占用空间大。

        新建的方法:windows桌面点”开始“,打开Anaconda Prompt:

输入conda create -n <env_name> python=<version>,将<env_name>换为新环境的名称,<version>换为python版本,例如:

克隆base环境的方法:

输入conda create -n <env_name> --clone base,例如:

这里用新建的方法创建一个新环境,名称为pytorch:

打开Anaconda Promp,输入conda create -n pytorch python=3.9,创建完成后输入conda activate pytorch,切换到pytorch环境:

 输入:conda install <pytorch本地安装包的位置>,把pytorch本地安装包的位置换为第2步中下载的bz2文件的存储路径,我这里是H:\CUDAS\pytorch-1.13.1-py3.9_cuda11.6_cudnn8_0.tar.bz2

 4、验证

安装完成后,输入conda list,出现下面内容,就安装成功了

在python中验证:先输入python,再输入import torch,如果出错,例如我的就出错了:

 解决方法:首先输入exit()退出python,然后输入conda update --all,升级,就不会报错了。

 再次进入python输入:import torch

                   torch.cuda.is_available()

结果虽然没有报错,但输出了False,其含义是cuda不可用:

 分析原因,是conda升级的时候将pytorch升级成了CPU版的2.30

 退出python,输入pip uninstall torch,卸载pytorch:

再次安装pytorch:

 安装完成后再次验证:

 输出了True,pytorch安装完成。

输入代码,测试一下:

import torch
import numpy as np
test=np.array([[1,2,3,4],[5,6,7,8]])
x=torch.tensor(test)
print(x)

   输出如下:     

       

torchvision

版本对应关系:torch torchvision版本对应关系_torch与torchvision版本对应-CSDN博客

本机的torch版本1.13.1对应的vision版本是0.14.0,打开清华源Index of /anaconda/cloud/pytorch/win-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 下载正确版本的vision,vison=0.14,python=3.9,cuda=11.6:

打开虚拟环境的命令行窗口,用pip install:

出错了。继续用conda install:

 下载了某些依赖包之后,安装成功。

pycharm  

一、下载文件

打开链接: Other Versions - PyCharm

选择版本:

 我这里选择了2022.2的社区版

二、安装

一路next,遇到这个全部选勾

三、安装插件

 1、汉化菜单

运行pycharm,新建项目,并打开,file--setting--plugins:

 选择中文语言包并安装:

安装之后,重启pycharm,菜单就是中文了。

 2、安装腾讯AI助手

 打开文件--设置--插件:输入“腾讯AI助手”,点击安装。

 腾讯AI助手在补全代码和预测你的编程意图方面,使用很方便。

3、添加解释器

 pycharm窗口右下角,添加新的解释器--添加本地解释器

 选择之前创建的pytorch虚拟环境下的Python.exe,点确定

 在脚本中输入之前使用过的测试代码:

运行结果:

 到此为止,安装基本完成。

opencv

opencv的安装过程见下:

机器视觉学习笔记和过程记录:下载安装OpenCv_python3.8安装opencv-CSDN博客

matplotlib

        由于之前的pytorch所在的虚拟环境下的python安装的是3.9版,matplotlib的版本设置与python相同即可(即python为3.9,matplotlib的版本也设为3.9)。
激活相应的conda虚拟环境,并使用pip install工具安装即可。

 注意,必须指定版本pip install matplotlib==3.9.0这样子,如果使用默认版本pip install matplotlib它会将pytorch改为cpu版的最新版,如下所示,这并不是我希望看到的:

 pandas

使用pip安装了pandas,当import pandas的时候,出现了以下提示:

A module that was compiled using NumPy 1.x cannot be run in
NumPy 2.0.2 as it may crash. To support both 1.x and 2.x
versions of NumPy, modules must be compiled with NumPy 2.0.
Some module may need to rebuild instead e.g. with 'pybind11>=2.12'.

If you are a user of the module, the easiest solution will be to
downgrade to 'numpy<2' or try to upgrade the affected module.
We expect that some modules will need time to support NumPy 2.

        意思是当前版本的pandas要求numpy版本<2,我安装过的的numpy版本是2.1。看很多教程说或者降级Numpy到1.x.x,或者升级pandas到最新版,或者全部将pandas和numpy卸载后重装,试过后都不行,总之一塌糊涂,各种报错。
        索性重新建立一个虚拟环境,然后使用conda install pandas,让anaconda去自动选择所有软件的版本。在conda的安装过程中会自动安装合适版本的numpy。

h5py

开始用pip install h5py的方法安装了最新版本3.9,在运行时出现了以下错误提示:

Traceback (most recent call last): File "E:\AI_tset\mnist\main.py", line 3, in <module> from MainWidget import MainWidget File "E:\AI_tset\mnist\MainWidget.py", line 12, in <module> import DeepNET File "E:\AI_tset\mnist\DeepNET.py", line 7, in <module> import h5py File "C:\Users\DY\.conda\envs\torch\lib\site-packages\h5py\__init__.py", line 33, in <module> from . import version File "C:\Users\DY\.conda\envs\torch\lib\site-packages\h5py\version.py", line 15, in <module> from . import h5 as _h5 File "h5py\\h5.pyx", line 1, in init h5py.h5 ImportError: DLL load failed while importing defs: 找不到指定的程序。

感觉每天都是在与版本的兼容战斗。。。。 

查资料,h5py与python以及numpy的版本兼容:

  • h5py 3.6.0:

    • 适配 Python 3.6 - 3.10
    • 需要 NumPy 1.19.3 或更高版本
  • h5py 2.10.0:

    • 适配 Python 3.5 - 3.8
    • 需要 NumPy 1.16.0 或更高版本
  • h5py 2.9.0:

    • 适配 Python 3.5 - 3.8
    • 需要 NumPy 1.16.0 或更高版本

 pip uninstall h5py   # 卸载

pip install h5py==3.6.0  # 降低版本

安装完成后运行正常。。。

猜你喜欢

转载自blog.csdn.net/xulibo5828/article/details/141335160#comments_35068959