The user does not have permission to access NVIDIA GPU Performance Counters on the target device 0

遇到报错很苦恼

1701257434767

如何解决?

使用sudo权限,即使用sudo ncu来执行命令

又遇报错相当苦恼

1701257566590

如何解决?

  • 使用ncu的绝对路径,位于cuda安装目录的bin文件夹下,比如这样:/data/user/cuda113/bin/ncu (需自行替换,这里只是举例说明)

  • 同理,此时python也应使用绝对路径(可以不用试试,会报类似上面的错误),位于conda安装目录下面的虚拟环境文件夹中,你想用哪个虚拟环境的python,就进入对应的目录寻找,比如这样:/data/user/conda/envs/py38/bin/python (需自行替换,这里只是举例说明)

  • 根据前面的例子来说,最终命令是这样的:

    sudo /data/user/cuda113/bin/ncu /data/user/conda/envs/py38/bin/python test.py

    根据自己的需要,加入想要分析的内核,比如下面这样,分析名称为aaa或bbb的内核:

    sudo /data/user/cuda113/bin/ncu -k "aaa|bbb" /data/user/conda/envs/py38/bin/python test.py

大功告成!!!

猜你喜欢

转载自blog.csdn.net/illyh/article/details/134697709
今日推荐