9.主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

一般是减少样本中不相关的特征,加快模型的训练速度和效率,比如预测今天是否会下雨,其中性别比例就是多余的特征。

2、PCA

就是识别数据中主要的特征,然后通过分析特征值,确定出需要保留的主成分个数,舍弃其他主成分,从而实现数据的降维。

二、并用自己的话阐述出两者的主要区别

特征选择是不改变原有数据的情况下进行特征的选择;

而PCA则是通过降维来“压缩”数据的特征,比如原数据中一个值是10,降维后变为5,从本质上来说,数据的特征并没改变。

原文地址:https://www.cnblogs.com/av10492/p/12815692.html