机器学习-线性回归补充-实践

线性回归分析过程中可能会遇到的问题

选定自变量时候要注意:去除多重共线性干扰

 什么是多重共线性干扰?

强相关变量

多重共线性

避免将两个强相关变量输入到一个模型中,解决办法是只保留一个。

消除多重共线性的方法:

如果GVIF>10 则需要调整

如何挑选输入模型的自变量

输入的自变量多是有好处的,能够提升回归模型的准确性。另一方面,建设输入的自变量也是有好处的,可以方便业务同事理解。

权衡自变量多少的标准:

用olsrr包的ols_all_possible()函数

以上数据都计算出来后就可以创建线性回归模型

分析模型

 

原文地址:https://www.cnblogs.com/Grayling/p/10990739.html