RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案

运行 pytorch gpu 时,报这个错
在这里插入图片描述
网上有很多人也遇到这个问题,有人说是 CUDA 和 cudnn 的版本匹配问题,有人说需要重装 Pytorch,CUDA,cudnn。我看了官网,版本是匹配的,试着重装了也不管用,而且我按照另一个系统的版本装也不行。

可以看到每次报错都在 conv.py 这个文件,就是在做 CNN 运算时出的错。

解决方法是引入如下语句

import torch
torch.backends.cudnn.enabled = False

这句话的意思是不用 cudnn 加速了。

GPU,CUDA,cudnn 的关系是:

  • CUDA 是 NVIDIA 推出的用于自家 GPU 的并行计算框架,只能在 NVIDIA 的GPU 上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥 CUDA 的作用。
  • cuDNN 是 NVIDIA 打造的针对深度神经网络的加速库,是一个用于深层神经网络的 GPU 加速库。如果你要用 GPU 训练模型,cuDNN 不是必须的,但是一般会采用这个加速库。

参考:GPU,CUDA,cuDNN的理解

cudnn 默认会使用,既然目前解决不了匹配问题,就先不用了。这样 gpu 照样能工作,但可能没有用上 cudnn 那么快。

如果有朋友知道该怎么解决可能的版本问题,欢迎交流~

附:

  • 版本:win10 , python 3.6 ,pytorch 1.1.0 ,CUDA 9.0,cudnn 7.1.4
  • 测试用例:pytorch github 上的例子 Basic MNIST Example
原创文章 46 获赞 36 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_38673554/article/details/103022918