最后一层是sigmoid或者softmax激活函数的神经网络,为什么不适合用平方误差损失函数?

最后一层是sigmoid或者softmax激活函数的神经网络,为什么不适合用平方误差损失函数?

猜你喜欢

转载自www.cnblogs.com/jiayibing2333/p/12902581.html