RuntimeError:CuDNN error:CUDNN_STATUS_EXECUTION_FAILED

问题:RuntimeError:CuDNN error:CUDNN_STATUS_EXECUTION_FAILED

解决:我的问题和下面的情况8类似(说是3090显卡仅支持cuda11以上的版本),我的电脑3090显卡,用cuda9.2以及对应版本的pytorch一直报错。换用cuda11和对应的新版本的pytorch,程序立马不报错了+运行速度超级快。  

网上的一些说法:(仅记录)

1)解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED_乒乒乓乓丫的博客-CSDN博客

绝大多可能就是cuda,cudnn,vs,python,pytorch版本,其中某个版本出了问题

2)(已解决)pytorch错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED (安装cuda)_竹篓有个天的博客-CSDN博客

原因:pytorch与cuda版本不对(也有可能是内存空间不足,可以更改虚拟空间大小)。重新安装了显卡驱动能够支持的cuda版本。

3)解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 踩过的坑(配置环境:linux+anaconda3+pytorch ...)_Lomen_280的博客-CSDN博客4)RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED_Huntersts的博客-CSDN博客

“总的来说,还是环境配置的不对,个人认为,最主要的是安装pytorch的时候的cuda版本,真的是错一点点都不行~~    然后我就综合方法3,卸载了之前的环境,仔仔细细地认认真真地又配置了一遍各种环境,下面就是正确解决这个错误的方法了。”

4) cuDNN error: CUDNN_STATUS_EXECUTION_FAILED和cuda的卸载和安装 

cuDNN error: CUDNN_STATUS_EXECUTION_FAILED这种错误在网上的资料很少,有人说是因为python,pytorch,cuda等的版本不适配导致的,有人将python换成3.6版本的就解决了,但有的没有。
在我这里,原因出在显卡和cuda的不适配上,我用的RTX2080ti,本来装的是cuda9,就出现了上述bug,经过多次探索,将cuda换成10后,问题解决,估计是2080ti的显卡太新,所以在最新的cuda上使用比较好。
 

5)RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED_Huntersts的博客-CSDN博客 

网上关于这个问题的解决方法有很多,有的是更换cudatoolkit,还有的是更换torch和Python的版本的,但是这些在我这里并不适用.

6)RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED - 哔哩哔哩

         

7)RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED · Issue #109 · NVIDIA/tacotron2 · GitHub可能是由于pytorch版本,驱动程序版本,cuda版本和cudnn版本的不兼容引起的。

8)CUDNN error: CUDNN_STATUS_EXECUTION_FAILED解决方法

本人在ubuntu18.04系统复现执行cyclegan网络过程,使用显卡GeForce RTX 3090,该显卡仅仅支持使用cuda11以上的版本

由于之前配置官网指导环境pytorch1.4.0,误选用cuda10.1及cuda10.2,导致每次运行test.py过程极慢,半天过后报错CUDNN error: CUDNN_STATUS_EXECUTION_FAILED,

后来,更换cuda11,对应的pytorch版本也就高于1.4.0了,程序才运行飞起,究其原因,在于显卡本身不支持cuda11以下版本,无语凝噎,也就说这里所谓的版本不匹配,是显卡硬件型号与cuda本身版本不匹配导致的报错,Mark一下,希望能对大家有所用处。
 

9)CUDNN error: CUDNN_STATUS_EXECUTION_FAILED解决方案

考虑这个报错应该是出于pytorch的版本与CUDA不协调的问题,(我安装的是CUDA10.2,可能版本太新了,如果没安CUDA的还是建议走10.0问题少一些,不过9.0版本的好像也有这个报错)。

随后,安装新版的支持cuda10.0的pytorch以及cuda工具包。目前为止再跑训练模型的时候还没有报错。

10)解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

情况1:自己的cuda、cudnn、python、pytorch版本不匹配。注意,尤其是python的版本是很容易忽略的。

情况2(我的情况是这种):在情况1满足的条件下,查看自己的程序所使用的显卡占用量是不是满了,如果满了就换未使用的卡(‘cuda:3’ —> ‘cuda:0’)。

情况3:在代码中加入
torch.backends.cudnn.enabled = False

猜你喜欢

转载自blog.csdn.net/weixin_39450145/article/details/125630966