动量梯度下降(Momentum、指数加权平均)、逐参数适应学习率方法(Adagrad、RMSprop、Adam)、学习率退火、归一化/标准化 其他 2020-03-18 10:50 0 阅读 NoSuchKey 猜你喜欢