pytorch 使用指定的GPU RuntimeError: CUDA error: invalid device ordinal - 代码天地

pytorch 使用指定的GPU RuntimeError: CUDA error: invalid device ordinal

其他 2020-08-03 20:11:07 阅读次数: 0

pytorch使用指定GPU报错：

Traceback (most recent call last):
  File "test_bed/process_deepglint.py", line 102, in <module>
    pred_dataset(outputFile)
  File "test_bed/process_deepglint.py", line 36, in pred_dataset
    pred_loader_deepg, model, criterion, attrWeights, useArcface = main()
  File "/home/user1/main_cs_0708.py", line 114, in main
    model = models.__dict__[arch]()
  File "/home/user1/models/arc_face.py", line 35, in arcface
    learner = arc_face.face_learner(conf, inference=True)
  File "/home/user1/arc_face/Learner.py", line 24, in __init__
    self.model = Backbone(conf.net_depth, conf.drop_ratio, conf.net_mode).to(conf.device)
  File "/home/user1/miniconda3/lib/python3.7/site-packages/torch/nn/modules/module.py", line 386, in to
    return self._apply(convert)
  File "/home/user1/miniconda3/lib/python3.7/site-packages/torch/nn/modules/module.py", line 193, in _apply
    module._apply(fn)
  File "/home/user1/miniconda3/lib/python3.7/site-packages/torch/nn/modules/module.py", line 193, in _apply
    module._apply(fn)
  File "/home/user1/miniconda3/lib/python3.7/site-packages/torch/nn/modules/module.py", line 199, in _apply
    param.data = fn(param.data)
  File "/home/user1/miniconda3/lib/python3.7/site-packages/torch/nn/modules/module.py", line 384, in convert
    return t.to(device, dtype if t.is_floating_point() else None, non_blocking)
RuntimeError: CUDA error: invalid device ordinal

原因可能是：

代码中多个位置设置了使用哪些GPU，相互冲突，包括但不限于以下形式：os.environ, torch.device, torch.cuda.set_device, args.gpu_id等等，具体代码具体分析。不同代码作用范围不同，可能你后来设置的没有起到作用，起作用的是之前设置的。
os.environ和 torch.device没有配合好。详见：matt-gardner@https://github.com/allenai/allennlp/issues/1090
torch.device API 官方：https://pytorch.org/docs/stable/tensor_attributes.html

在我的代码中最后设置的就是：

os.environ['CUDA_VISIBLE_DEVICES'] = '1,'
conf.device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

这样设置的就是使用第二个GPU，序号为1

猜你喜欢

转载自blog.csdn.net/qxqxqzzz/article/details/107720675

pytorch 使用指定的GPU RuntimeError: CUDA error: invalid device ordinal

RuntimeError: CUDA error (10): invalid device ordinal

RuntimeError: CUDA error: invalid device ordinal

解决RuntimeError: CUDA error: invalid device ordinal

Pytorch 读取参数错误 RuntimeError: cuda runtime error (10) : invalid device ordinal

Pytorch load深度模型时报错：RuntimeError: cuda runtime error (10) : invalid device ordinal

RuntimeError: CUDA error: invalid device ordinal (exchangeDevice at /opt/conda/conda-bld/pytorch_154

Python 错误 RuntimeError: CUDA error (10): invalid device ordinal

RuntimeError: CUDA error: invalid device ordinal解决方案

CUDA error: invalid device ordinal

RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported

pytorch错误RuntimeError: CUDA error: device-side assert triggered

Debug Pytorch: RuntimeError: CUDA error: device-side assert triggered

记录配置mmpose出现的cuda报错RuntimeError: CUDA error: invalid device function

【error】RuntimeError: cuda runtime error (59) : device-side assert triggered at /pytorch/torch/lib/TH

pytorch报错：RuntimeError: CUDA error: device-side assert triggered究极解决方案

【Pytorch】【DataLoader】RuntimeError: CUDA error: initialization error

解决报错：RuntimeError: Invalid device string: ‘cuda：0‘

[Pytorch] RuntimeError: Attempting to deserialize object on CUDA device 2

RuntimeError: cuda runtime error (710) : device-side assert triggered at /pytorch/aten/src/THC/generic/THCTensorMath.cu:26

RuntimeError: CUDA error: device-side assert triggered

【RuntimeError: CUDA error: device-side assert triggered】问题与解决

解决记录 RuntimeError: CUDA error: device-side assert triggered

已解决RuntimeError: CUDA error: no kernel image is available for execution on the device

[已解决]RuntimeError: CUDA error: no kernel image is available for execution on the device

【bug记录】RuntimeError: CUDA error: device-side assert triggered

RuntimeError: CUDA error: no kernel image is available for execution on the device

一步解决【ERROR】RuntimeError: CUDA error: no kernel image is available for execution on the device

解决pytorch错误ImportError: Failed to load PyTorch C extensions:和RuntimeError:CUDA error:unknown error

RuntimeError:CUDA error:unknown error

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)