二分类(y=0或1),如果只能给出一个常数作为 y=1的概率预测,那么这个常数将为
N1/N (N为样本总数,N1为正样本数量)
相应的,y=0的概率就是1-N1/N
比如90个正样本,10个负样本,那么,如果只能给出一个常数值作为log loss的最优解,这个值就是
90/(90+10)=0.9
即认为样本是正例的概率是0.9
----------------------------------------------------------------
只需要按照loss关于alpha的导数为0即可推导出上面这个结论