拓端数据tecdat|R语言多项式回归拟合非线性关系

原文链接:http://tecdat.cn/?p=22438 

原文出处:拓端数据部落公众号

多项式回归是独立x变量和因果y变量之间的非线性关系。

当我们分析有一些弯曲的波动数据时,拟合这种类型的回归是很关键的。 
在这篇文章中,我们将学习如何在R中拟合和绘制多项式回归数据。我们在这个回归模型中使用了lm()函数。虽然它是一个线性回归模型函数,但通过改变目标公式类型,lm()对多项式模型也适用。本教程包括

  1. 准备数据
  2. 拟合模型
  3. 寻找最佳拟合
  4. 源代码

准备数据

我们首先要准备测试数据,如下所示。

  1.  
    function(x) x^3+2*x^2+5
  2.  
     
  3.  
     
  4.  
    df = data.frame(x = x, y = y)
  5.  
    head(df)
  6.  
     
  7.  
     


我们可以将'df'数据可视化,在图中进行直观的检查。我们的任务是用最佳曲线拟合这个数据。

plot(df$x, df$y

拟合模型

我们用lm()函数建立一个带有公式的模型。  I(x^2)在一个公式中代表x2。我们也可以使用poly(x,2)函数,它与I(x^2)的表达方式相同。


接下来,我们将用训练好的模型来预测数据。

pred = predict(model,data=df)



寻找最佳拟合

找到最佳拟合的曲线很重要。我们用各种可能的函数检查模型。在这里,我们应用四种类型的函数进行拟合,并检查其性能。
橙色线(线性回归)和黄色曲线对这个数据来说是错误的选择。粉红色曲线很接近,但蓝色曲线是与我们的数据趋势最匹配的。因此,我使用y~x3+x2公式来建立我们的多项式回归模型。
你可以通过将你的数据可视化来找到最适合的公式。



源代码列在下面。

  1.  
     
  2.  
    lines(df$x, predict(lm(y~x, data=df)), type="l" lwd=2)
  3.  
     
  4.  
    legend("topleft",
  5.  
    legend = c("y~x, - 线性","y~x^2", "y~x^3", "y~x^3+x^2"),



绘制结果

1. 用plot()函数作图。



2. 用ggplot()作图。
多项式回归数据可以用ggplot()拟合和绘制。

  1.  
    ggplot(data=df ) +
  2.  
    geom_smooth( y~I(x^3)+I(x^2))



在本教程中,我们简要了解了如何拟合多项式回归数据,并使用R中的plot()和ggplot()函数绘制结果,完整的源代码如下。


最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接:http://y0.cn/teradat ▍联系邮箱:3025393450@qq.com
原文地址:https://www.cnblogs.com/tecdat/p/14837769.html