7.谷歌《机器学习速成课程》笔记---验证

原先结构图(只有训练集、测试集):
其结果导致过拟合,训练集与测试集之间会相互影响,也就是测试集的信息会有一部分在训练模型中,导致预测结果会偏高,从而误导了我们对模型的认识。
这里写图片描述

修改后的模型,加入了验证集,测试集完全没使用过,保证了训练模型对测试集信息完全未知,这样更符合实际,预测效果的准确性也就更可靠。
这里写图片描述

提示

  • 不断使用测试集和验证集会使其逐渐失去效果。也就是说,您使用相同数据来决定超参数设置或其他模型改进的次数越多,您对于这些结果能够真正泛化到未见过的新数据的信心就越低。请注意,验证集的失效速度通常比测试集缓慢。
  • 如果可能的话,建议您收集更多数据来“刷新”测试集和验证集。重新开始是一种很好的重置方式。

猜你喜欢

转载自blog.csdn.net/fuego801/article/details/80298751
今日推荐