机器学习西瓜书白话解读笔记---0201-0207、模型的评估与选择

机器学习西瓜书白话解读笔记---0201-0207、模型的评估与选择

一、总结

一句话总结:

【一起啃书】机器学习西瓜书白话解读:这个视频好短好短呀,【课程一定要短】这样课程非常非常好录,这样录出来的质量会非常好
这个up主喜欢说哒哒哒,这个讲课【很自在,好亲切】呀

1、留出法?

就是很简单的两个互斥集,也就是什么【三七分,二八分】

2、k折交叉验证?

k折交叉验证非常简单:就是将【数据集分k份,留一份做测试集,其它做训练集】,然后【结果做平均】
k折交叉验证的缺点:【数据量较大时,对算力要求较高】

3、自助法?

自助法也非常简单:就是【随机在数据集D中抽m次形成一个含m个数据的D'】
自助法【适用】:【数据及较小,难以划分的时候】
自助法【缺点】:【改变初始数据集分布,会引入估计偏差】

4、验证集作用?

验证集就是为了【调参】
【训练集训练,验证集看结果,调参,再看验证集结果参数调完,最后再测试集上看结果】
为了泛化能力,有训练集和测试集,为了【调参,有验证集】

5、均方误差?

回归任务最常用的性能度量是“均方误差”(mean squared error):$$E ( f ; D ) = frac { 1 } { m } sum _ { i = 1 } ^ { m } ( f ( x _ { i } ) - y _ { i } ) ^ { 2 }$$
更一般的,对于数据分布D和概率密度函数p(-),均方误差可描述为:$$E ( f ; D ) = int _ { x sim D } ( f ( x ) - y ) ^ { 2 } p ( x ) d x$$
因为是【均方误差,所以有平均,所以无论是上下两个公式,都有平均在里面】

二、模型的评估与选择

博客对应课程的视频位置:

 
我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
博主25岁,前端后端算法大数据人工智能都有兴趣。
大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
聊技术,交朋友,修心境,qq404006308,微信fan404006308
26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
人工智能群:939687837

作者相关推荐

原文地址:https://www.cnblogs.com/Renyi-Fan/p/14028325.html