回归分析

2017/6/23 19:03:33

一、概述

回归分析统计方法研究变量之间的关系并对其构建模型。回归的应用领域广泛,几乎遍及所有学科。

在几乎所有的回归领域中,回归方程只是实际函数关系的逼近。实际的函数关系通常以人们对理论中潜在机理的了解为基础产生的,这类模型称之为机理模型。而回归分析却不同,人们将其视为经验模型

(一) 由来

英国统计学家 F.Galton 和他的学生 K.Pearson 在研究父母身高与其子女身高的遗传问题时,将每对夫妇的平均身高作为 x(单位:英寸),而取他们的一个成年儿子的身高作为 y,将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。计算出的回归直线方程为

Galton 引入了“回归”这个名词来描述父辈身高 x 和子代身高 y 的关系。

从 1809 年,Guass 提出最小二乘法算起,回归分析的历史已有二百年,它所研究的内容已十分丰富,主要包括

  • 线性回归
  • 回归诊断
  • 回归变量的选择
  • 参数估计方法的改进
  • 非线性回归
  • 含有定性变量的回归
  • 非参数回归

(二) 回归模型的一般形式

如果变量 与随机变量 y 之间存在相对关系,通常意味着每当 取定值之后,y 便有相应的概率分布与之对应,即

其中,随机变量 y 称为被解释变量(因变量), 称为解释变量(自变量),ε 为随机误差 为一般变量 的确定性关系。当 时候,我们称之为“线性回归”。

(三) 模型适用性检验

回归分析的下一阶段称为模型适用性检验。模型适用性检验研究模型的适当程度,确定拟合质量的高低。模型适用性检验有两种可能的结果,要么表明模型是合理的,要么表明我们必须修正原来的拟合方案。因此,回归分析是一个反复的过程。

二、一元线性回归

(一) 数学形式

考虑以下式子

假定 ,那么有

我们称上式为回归方程。

回归分析的主要任务就是通过 n 组观测值 进行估计。一般使用 分别表示 的估计值,则称

为 y 关于 x 的一元经验回归方程

(二) 回归参数 的估计

下面使用普通最小二乘估计(ordinary least squares estimate, OLSE),进行参数估计。

的估计(),称

残差。残差刻画了在一个样本点上估计值与实际值的偏差,而残差平方和 Q

则是从整体上刻画 n 个样本观测点到回归直线距离的 大小。

使得残差平方和 Q值最小的那一组 便是回归参数 的最小二乘估计,即

根据微积分中求极值的原理,应满足下列方程组

解得

其中,

(三) 斜率和截距的假设检验

由于误差 ...

三、多元线性回归

对于上面的式子,我们假设

于是,我们得到

残差平方和 Q

最小二乘估计量必须满足

...(未完)

参考文献

[1] 何晓群,闵素芹. 实用回归分析(第二版). 高等教育出版社. 2014
[2] 道格拉斯 C.蒙哥马利等. 线性回归分析导论[M]. 王辰勇 译. 机械工业出版社. 2016.

原文地址:https://www.cnblogs.com/super-zhang-828/p/7071422.html