深度学总结:RNN训练需要注意地方:pytorch每一个batch训练之前需要把hidden = hidden.data,否者反向传播的梯度会遍历以前的timestep

NoSuchKey

猜你喜欢

转载自blog.csdn.net/weixin_40759186/article/details/87855380