模型指标和策略

查准率P:

查全率R:

两者结合之后新的指标F1分数(P、R的平均值也叫调和平均数):

利用F1这个单一实数指标来判断。

开发集以及验证集最好来自同一分布:方法是将数据全部打乱,然后从中抽取。

大量数据分配到训练集,其余少量数据分配到开发集和测试集,利用开发集选出不同的方法,测试集的目的是评估你最后的成本偏差。

人类水平误差用来估计贝叶斯误差,能够达到的最低值,当接近人类水平时,更难分辨出问题是偏差还是方差,所以此时进展会更缓慢。

误差分析:找到出现错误的例子中,影响最大的特征,对这个特征进行修改。

扫描二维码关注公众号,回复: 5619259 查看本文章

猜你喜欢

转载自blog.csdn.net/qq_30122883/article/details/88352774