预测函数: hθ(x)=g(θTx)=11+e−θTx h θ ( x ) = g ( θ T x ) = 1 1 + e − θ T x
hθ(x) h θ ( x ) 的取值即为y=1的概率,1- hθ(x) h θ ( x ) 即为y=0的概率。
所以y~B(1, hθ(x) h θ ( x ) ),两点分布。
y的分布列为 p(y)=(hθ(x))y(1−hθ(x))1−y p ( y ) = ( h θ ( x ) ) y ( 1 − h θ ( x ) ) 1 − y
似然函数 L(θ)=∏mi=1p(y) L ( θ ) = ∏ i = 1 m p ( y ) (意思就是使得已经发生的事情的概率达到最大)
接下来就是加log,求偏导的过程了。