偏差与方差的总结

  今天开始重新仔细学习西瓜书(机器学习),今天看完了第一章,第一章基本都是一些概念的东西,公式也比较少,希望可以坚持把这本书看完。

基本概念

  根据各种公式推导得知,泛化误差 = 偏差 + 方差 +噪声
  而偏差(bias)度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力。方差(Variance)度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响。
此处输入图片的描述

偏差与方差的关系

  偏差与方差是有冲突的。给定学习任务,假定我们能控制学习算法的训练程度,则在训练不足时,模型的拟合能力不够强,训练数据的扰动不足以使模型产生显著变化,此时偏差主导了泛化错误率;随着训练程度的加深,模型的拟合能力逐渐增强,训练数据发生的扰动渐渐能被模型学习到,方差逐渐主导了泛化错误率;在训练程度充足后,模型的拟合能力已经非常强,训练数据发生的轻微扰动都会导致模型发生显著变化,若训练数据自身的,非全局性的特性被模型学习到了,则将发生过拟合。
此处输入图片的描述

-------------本文结束感谢您的阅读-------------
如果对你有帮助,方便的话麻烦给我的午饭加一颗卤蛋