维度灾难

维度灾难带来的问题

由上面我们明白了,有了更好的区分样本类别,我们需要增加特征值个数,从而引来维度灾难问题,那么维度灾难有什么后果呢?

增加了特征值得个数,从而造成了需要填充特征值空间的样本数据以指数形式增长,这对于收集样本数据来说是个恐怖的事情,试想下如果每个维度有100个值对应,那么需要填充5个特征值对应的特征值空间需要的样本数据至少需要100

5

=10000000000=100

亿,而且这是“至少”,因为这是按照每个特征值都对应一个数值,但是这样下来,需要找100亿个所有特征值都不相同的数据,其中免不了有些数据的特征值有相同的,那么实际收集的样本数据个数将会更多,这将会是一件恐怖的事情。

原文地址:https://www.cnblogs.com/hrnn/p/13552486.html