偏差和方差 bias 偏差 偏差反应的是算法的预测值与真实值的差距,偏差越大,越偏离真实的数据,也就越学不到东西。 variance 方差 方差反应的是预测值的范围,离散程度,也就是离平均值的距离。 方差越大,数据的分布越分散。 variance =sum of squared deiviations(diviation from mean) devided by n | mean of squared deviations 平均平方偏差:平方偏差之和除以n | 平方偏差的均值 R square: 预测值与实际值的相关度 我们将训练集和测试集分隔开,以便更好地了解能否将模型泛化到未见过的数据而不是拟合到刚见过的数据。