拓端tecdat|R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图

原文链接:  http://tecdat.cn/?p=23697

原文出处:拓端数据部落公众号

我们使用R库mgcv,用广义加性模型(GAMs)对环境数据进行建模。mgcv是一个伟大的库,具有丰富的功能,但我们经常发现,默认的诊断图并不令人振奋。特别是偏残差图,功能很强,但不漂亮,残差几乎看不见。我们需要根据这些代码来制作自己的偏回归平滑图。

1) 基本的数据设置

我们正在使用这里讨论的数据集。我们使用的是国家发病率和死亡率空气污染研究(NMMAPS)的数据。我们将数据限制在1997-2000年。

data[date>as.Date("1996-12-31"),]

2) 简单的GAM模型--温度对臭氧

在这个例子中,我们保持模型的简单性--使用高斯数据,单一预测因子。我们对温度与臭氧进行建模,我们将输出默认的偏残差图。

  1.  
     
  2.  
    # 模型 - 温度对臭氧的影响
  3.  
    plot(gam)
  4.  
     

这个图可以改进?

3) 重新制作偏残差图

偏残差图(Partial Residual Plot)是多元回归中常用的诊断工具,特别是评估模型中在一个或另一个解释变量中是否包含非线性项。在多元回归y=β0+β1x1+…+βpxp+ε中,若欲反映其中变量Xj与因变量y之间的关系并用图形显示,其方法之一是用偏残差图。

在这里,我们加入平滑项、置信区间和偏残差。

  1.  
     
  2.  
    #我们可以在多边形的顶部添加线条
  3.  
    qplot(temp, fit, type="n")+poly(c(temp, rev(temp)),
  4.  
    c(low95,rev(up95))# 对于置信度的灰色多边形
  5.  
     
  6.  
     

在最后一步,我们要加入偏残差本身。偏残差是平滑项的估计值+整个模型的残差。

  1.  
     
  2.  
    #添加偏残差。
  3.  
     
  4.  
    points(temp,partial.resids)
  5.  
     
  6.  
     

为便于参考,这里是完整模型的摘要。

模型 - 温度对臭氧的影响 


最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言混合效应逻辑回归Logistic模型分析肺癌

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

8.python用线性回归预测股票价格

9.R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接:http://y0.cn/teradat ▍联系邮箱:3025393450@qq.com
原文地址:https://www.cnblogs.com/tecdat/p/15250673.html