拓端tecdat|R语言自适应平滑样条回归分析

原文链接:http://tecdat.cn/?p=14854 

 

一种类型的平滑称为样条平滑。柔性金属(通常是铅),可以用作绘制平滑曲线的参考。将选择一组点(称为结),然后将样条线压在特定的x,y点,然后弯曲以通过下一个点,依此类推。由于金属的柔韧性,此过程将生成通过这些点的平滑曲线。

在数学上,可以通过选择结点并使用(通常是三次)回归来估计结之间的点,并使用演算来确保每条单独的回归线连接在一起时曲线都平滑,从而重现该过程。平滑的程度由参数控制,通常在0和1之间的范围内。

为了说明,我们考虑由来自1910至2004年的小麦产量数据集 。

生成数据图,并叠加样条曲线平滑度。

  1.  
    > plot(wheat$year,wheat$production)
  2.  
    > lines(smooth.spline(wheat$year,wheat$production))
  3.  
     

结果如下:

应用的平滑量  由参数 spar 控制  。我们检查效果:

  1.  
     
  2.  
     
  3.  
     
  4.  
     
  5.  
    sapply(spars,plotfn)
  6.  
     

该图显示如下:

自适应平滑算法

尽管大多数平滑器需要指定带宽,数据部分或平滑级别,但超级平滑的不同之处在于它可以自行解决这些问题。因此,它是需要平滑处理而无需任何用户干预的情况的绝佳选择。Supersmoother通过执行许多简单的局部回归平滑来工作,并且在每个x值处,它使用这些平滑来确定要使用的最佳y值。在R中,可通过 supsmu  函数获得 超级平滑器。

为了说明这一点,考虑汽车数据。以下几行产生了 重量 与  MPG的关系图,并叠加了一条超平滑线。

该图显示如下:

带有面板的平滑算法

在使用点阵图形时,我们已经看到了 panel.lmline 的使用  ,它在点阵图的每个面板中显示最佳回归线。可以使用类似的函数  panel.loess 在图的每个面板中叠加局部加权回归平滑器。作为简单说明,考虑内置的  Orange  数据集,其中包含有关几棵橙树的年龄和周长的信息。首先,让我们看一幅具有最佳回归线平滑度的图,该图叠加在 每 棵树的年龄 与 周长图上  :

要创建相同的图,但要使用  panel.loess  函数,可以使用以下代码:

  1.  
    > xyplot(circumference~age|Tree,
  2.  
    +        ...)})
  3.  
     

如果 您想让它更平滑,可以使用  panel.lines  函数直接绘制它:

  1.  
    > xyplot(circumference~age|Tree,
  2.  
    +   ,...)})
  3.  
     


  

▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接:http://y0.cn/teradat ▍联系邮箱:3025393450@qq.com
原文地址:https://www.cnblogs.com/tecdat/p/13529947.html