TensorRT笔记(12)使用DLA

11.使用DLA

NVIDIA®DLA™(深度学习加速器)是用于深度学习操作的固定功能加速器引擎。 DLA旨在进行卷积神经网络的完整硬件加速。 DLA支持各种层,例如卷积,解卷积,完全连接,激活,合并,批处理规范化等。
有关NVIDIA®TensorRT™层中DLA支持的更多信息,请参阅DLA支持的层。 trtexec工具具有其他参数,可在DLA上运行网络,请参阅trtexec

要在FP16模式下使用trtexec在DLA上运行A

猜你喜欢

转载自blog.csdn.net/qq_33287871/article/details/113789291
今日推荐