机器学习--9

特征选择:

  事物体都具有特征属性,特征选择就是从这些特征属性中选取中能代表这种事物的特征,好比说一个人,头发、肤色、五官等都是特征属性,那么要找出非洲人的特征,就需要从中选择出有代表性的特征属性,肤色、语言等等

PCA:

  PCA是一种特征属性降低维度的一种方法,主要是保护数据,让数据更接近某种特征属性,举个例子,比如亚州人肤色都近似黄色,但是总会有一些例外的,为了方便统计,我们对数据进行压缩,那些其他肤色的亚洲人都默认他们的肤色都是近似黄色。

  改变了数据,保护了数据的信息量。

两者之间的区别很明显,前者就是直接剔除我们认为不能代表事物特征的特征属性,后者则是不惜修改数据来保护数据信息的减少,当然遇到不能保留的数据还是会舍弃,后者对于前者来说增加了一种对数据的体谅,因为不能每个数据都那么精准,那就只能用最接近事物特征的特征属性来替代,避免了数据流失,也确保特征的代表性。

原文地址:https://www.cnblogs.com/zzkai/p/12806986.html