当使用tensorflow-gpu进行模型训练时,出现的"CUDA_ERROR_LAUNCH_TIMEOUT"的报错,解决思路如下:
- 检查CUDA, CuDNN, Tensorflow版本是否对应以及兼容
- 运行简单代码
import tensorflow as tf
zeros= tf.zeros([10,10,3])
sess = tf.Session()
print(sess.run(zeros))
如果以上代码可以运行,则表明可能是模型过大导致的报错,可以尝试减小batchsize