最后一层是sigmoid或者softmax激活函数的神经网络,为什么不适合用平方误差损失函数?

NoSuchKey