1.9

Python数据预处理(sklearn.preprocessing)—归一化(MinMaxScaler),标准化(StandardScaler),正则化(Normalizer, normalize) 

Python enumerate() 函数将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,返回两个数组,第一个代表行索引,第二个代表列索引

np.triu_indices_from(arr,k = 0)返回arr的上三角矩阵,k是int型数据,可选,对角线偏移代表

reset_index()函数可以重置索引将原来的索引列变为正常的一列

 

如何理解方差膨胀因子(Variance Inflation Factor,VIF)

VIF一般用来衡量多重共线性,一般大于10即认为存在多重共线性

 

用Python的sklearn库进行PCA(主成分分析)_puredreammer的博客-CSDN博客_sklearn主成分分析

PCA和上面的多重共线性可以结合着用,PCA主要用于降维,我的理解是两个或多个特征间存在较强的相关性,就把它们融合成一个特征,从而降低维度,

用法:  【python】sklearn中PCA的使用方法_人间不值得-CSDN博客_sklearn的pca

 

绘制学习曲线——plot_learning_curve_昆兰.沃斯 的博客-CSDN博客_plot_learning_curve

学习曲线:一种用来判断训练模型的一种方法,通过观察绘制出来的学习曲线图,我们可以比较直观的了解到我们的模型处于一个什么样的状态,如:过拟合(overfitting)或欠拟合(underfitting)

 

原文地址:https://www.cnblogs.com/zhaoyids/p/15782695.html