为什么随机梯度算法中每一次都只用一个样本,却能保证参数最后收敛?

NoSuchKey

猜你喜欢

转载自blog.csdn.net/m0_37687753/article/details/80868838