CUDA 核函数调用核函数 - 代码天地

CUDA 核函数调用核函数

其他 2018-05-20 03:20:39 阅读次数: 3

这几天需要用到kernel函数包含kernel函数的例子，于是出现了几种问题：

一、

error : calling a global function(“childKernel”) from a global function(“kernel”) is only allowed on the compute_35 architecture or above

原因及解决方法：

这是因为默认计算能力被设定成了sm_20,compute_20,从而阻止你使用动态并行.

解决方案:
在您的项目属性中, 设定CUDA C/C++中的代码生成为:compute_50,sm_50
这样即可让您的5.0的卡, 支持动态并行, 也就是您说的核函数调用核函数.

二、

改成compute_50,sm_50了，然后从网上找了一个例子，还是报错：错误 17 error : kernel launch from device or global functions requires separate compilation mode
请问这个“独立编译模式”要怎么配置？

原因及解决方法：
-
其实只需要将RDC(可重定位设备代码)打开即可.

方式1:
在项目属性中, 设定CUDA C/C++的Generate Relocatable Device Code为True(-rdc=true).
同时所有所有cu文件中的该属性为”继承自项目”.

方式2:
手工将你所有的cu文件该属性设定为”真”.
然后可以不管项目属性.

任选一种.

三、

error LNK2001: unresolved external symbol ___fatbinwrap_66_tmpxft_00000b3c_00000000_17_cuda_device_runtime_compute_52_cpp1_ii_8b1a5d37.

原因及解决方法：
cuda从5.0版本之后开始支持dynamic parallelism，即可以在global函数中调用其他global函数，因此可以实现核函数中再调用核函数。
dynamic parallelism（动态并行）的软硬件条件有：
1. cuda toolKit 版本5.0或以上；
2. GPU compute capability（计算能力）3.5及以上。

此时就可以在核函数中调用另一个核函数了，也可以实现递归调用。但这时会出现如下link error：
error LNK2001: unresolved external symbol ___fatbinwrap_66_tmpxft_00000b3c_00000000_17_cuda_device_runtime_compute_52_cpp1_ii_8b1a5d37.

这是因为动态并行还需要附加另一个库：cudadevrt.lib。加入即可。

猜你喜欢

转载自blog.csdn.net/fanhenghui/article/details/80094620

CUDA 核函数调用核函数

CUDA 学习二: 核函数的调用

CUDA 核函数运行参数

cuda核函数编程小结

CUDA初始化与核函数

CUDA编程（二）：核函数与线程层级

CUDA核函数和内存管理

CUDA:核函数中几种变量所属内存的类型

CUDA优化--核函数--浮点数类型转换

深度学习部署(十一): CUDA RunTime API 核函数

CUDA中的动态并行---如何在核函数中启动另一个核函数

CUDA学习笔记1——线程组织、HelloWorld、数组相加、内存结构、核函数、设备函数

cuda 核函数中的参数说明<<<Dg, Db, Ns, S>>>

【小记录】cv::cuda::Stream中取出cudaStream_t并用于核函数的计算

3.5.cuda运行时API-核函数的定义和使用

CUDA编程模型系列九( topK 问题/规约/2_Pass核函数)

CUDA编程入门（一）：以图片运算看线程的组织和核函数的使用

深度学习部署(十六): CUDA RunTime API _vector-add 使用cuda核函数实现向量加法

3.8.cuda运行时API-使用cuda核函数加速yolov5后处理

核函数

【记录一个问题】cuda核函数可能存在栈溢出，导致main()函数退出后程序卡死30秒CUDA

核方法-核技巧-核函数

【记录一个问题】linux+opencv+cuvid解码1080P视频，当使用CUDA核函数的时候，必然崩溃

选择核函数的方法：

SVM核函数的选取

高斯核函数应用

svm常用核函数

SVM（3）核函数

SVM核函数总结

卷积核函数的选择

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)