一步解决【ERROR】RuntimeError: CUDA error: no kernel image is available for execution on the device

问题描述

在使用Linux服务器训练自己模型的时候,可能会出现下面的报错:

【ERROR】RuntimeError: CUDA error: no kernel image is available for execution on the device

CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

百度一下,解决方法千千万,不知道那个是不是适合你?

可以参照下面的教程操作~~~


原因分析:

看看你在Linux服务器训练的时候,有没有激活conda环境

        每次训练自己的模型的时候,都会主动激活conda环境,因为不激活是不能使用的~~~

        但是!!!也有特例,比如我用的这个Linux服务器,不用激活,也可以跑Pytorch。如下图

         应该是前人操作了一波,不过也带来问题了,因为你都不知道Pytorch是什么版本~~~,所以还是老老实实的激活自己的conda环境吧!!


解决方案:

按照你安装好的conda环境,进行激活

        以我的为例,我就需要使用如下命令进行激活

conda activate pytorch_3.8

        再次运行,成功开始训练~~~

 

什么? 还是不行,那你可以看下你的Pytorch版本是不是符合项目需求,如果符合,那你可以再去看看别人的博客解决方案了,后去的方法有时间更。

        欢迎关注蓝胖胖,咱们一起解决BUG~~~

猜你喜欢

转载自blog.csdn.net/Thebest_jack/article/details/126383239