网上关于这个错误的解决方案有:
方案1,tf老版本需要升级,安装nightly版本
方案2,tf是个贪心的框架,需要修改对GPU的配置,比如该链接https://ask.csdn.net/questions/714365
方案3,画重点,一样的现象是不同的问题根源。具体情况需要具体分析:
最近由于项目需要使用tf-gpu 12.0版本,依赖cuda9.0,但是环境里已经有cuda10,于是安装了两个版本(cuda9和cuda10并存),安装cuda9后理所当然的下载了cuda9对应版本的cudnn,但是这个cudnn拷贝了lib相关的库文件到cuda路径后就会出现下面的错误: “tensorflow.python.framework.errors_impl.internalerror: cudnn PoolFoward launch failed”
后来寻思着可能是cudnn版本问题,下载了cuda9对应的各个版本cudnn还是报错,后来使用nvidia-smi命令查看,显示的是CUDA Version10 ,于是下载了cuda10对应版本的cudnn后,问题解决。
所以目前成功的版本为:
CUDA: 9.0.176_384.81
CUDNN: V7.4.2 (cudnn-10.0-linux-x64-v7.4.2.24.tgz)
tensorflow: 1.12.0