机器学习知识总结---2、如何画roc曲线

机器学习知识总结---2、如何画roc曲线

一、总结

一句话总结:

改变阈值,算出tp和fp

1、roc曲线中,为什么tp(把正样本识别为正样本数)增加,fp(把负样本识别为正样本)也会增加?

鉴别能力一定,让更多好的东西进来,同时也会让更多不好的东西进来,就像小平同志说的,改革开放过后,好的东西会进来,同时苍蝇蚊子也会进来

2、支持向量机映射到高维实例?

比如x=[a,b] => φ(x)=[a^2,b^2,a,b,ab],就将2维映射到了5维

3、如何理解凸函数代数定义:对于任意的w1和w2,λ属于[0,1],有 f(λw1+(1-λ)w2) <= f(λw1) + f((1-λ)w2)?

其实λ等于0,就是w2点,如果λ等于1,就是w1点,而λ在0和1之间,所以点就在w1和w2之间

4、svm的φ(x)是无限维的?

φ(x)的设定是无限维的,但是计算可以不用用到这个无限维度

5、roc图(一般tp为纵轴,fp为横轴)中,如果人脸识别开门应用,那么厂商最看重的是哪个点?

fp(把负样本识别为正样本)为0的点的tp(把正样本识别为正样本数)的值

6、机器学习算法识别率高,算法就一定好么?

机器学习算法识别率高,不一定好,有专门的判别方式,也要根据具体的场景

7、svm(svm本身就是处理二分类问题的算法)如何处理多分类的问题?

分成一类或者其它类,其它类里面可以根据情况再分

8、归一化方法选择?

高斯的这个归一化比较好:减均值,除标准差

二、内容在总结中

博客对应课程的视频位置:

 
原文地址:https://www.cnblogs.com/Renyi-Fan/p/13299769.html