切换结点运行报错RuntimeError: CUDA error: unknown error

在07可以运行程序,但是到了08结点就会报错,报错如下:

可能的原因有:

  • GPU进程/线程死锁,缓存删除冲突;
  • CUDA版本不一致造成CUDA缓存冲突;
  • ……

解决方案:

删除   ~/.nv/   下的所有内容(找了半天还是东钦师兄帮忙解决了,感谢师兄!):

rm -rf ~/.nv/*

删除之后记得重连xshell客户端。

猜你喜欢

转载自blog.csdn.net/Answer3664/article/details/105319637
今日推荐