回归分析概念及原理

回归分析定义

  利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法

回归分析分类

  根据因变量和自变量的个数来分类:一元回归分析,多元回归分析

  根据因变量和自变量的函数表达式来分类:线性回归分析,非线性回归分析

几点说明

  • 通常情况下,线性回归分析是回归分析法中最基本的方法,当遇到非线性回归分析时,可以借助数学手段将其化为线性回归;因此,主要研究线性回归问题,一点线性回归问题得到解决,非线性回归也就迎刃而解了
  • 在社会经济现象中,很难确定因变量和自变量之间的关系,它们大多是随机性的,只有通过大量统计观察才能找出其中的规律。随机分析是利用统计学原理来描述随机变量相关关系的一种方法
  • 由回归分析法的定义知道,回归分析可以简单的理解为信息分析与预测。信息即统计数据,分析即对信息进行数学处理,预测就是加以外推,也就是适当扩大已有自变量取值范围,并承认该回归方程在该扩大的定义域内成立,然后就可以在该定义域上取值进行“未来预测”。当然,还可以对回归方程进行有效控制
  • 相关关系:可以分为确定关系和不确定关系。但是不论是确定关系或者不确定关系,只要有相关关系,都可以选择一适当的数学关系式,用以说明一个或几个变量变动时,另一个变量或几个变量平均变动的情况

回归分析主要解决的问题

回归分析主要解决方面的问题

  • 确定变量之间是否存在相关关系,若存在,则找出数学表达式
  • 根据一个或几个变量的值,预测或控制另一个或几个变量的值,且估计这种控制或预测可以达到何种精确度

回归分析步骤

  1. 根据自变量与因变量的现有数据以及关系,初步设定回归方程
  2. 求出合理的回归系数
  3. 进行相关性检验,确定相关系数
  4. 在符合相关性要求后,即可根据已得的回归方程与具体条件相结合,来确定事物的未来状况,并计算预测值的置信区间

回归分析的有效性和注意事项

有效性

  • 用回归分析法进行预测首先要对各个自变量做出预测。若各个自变量可以由人工控制或易于预测,而且回归方程也较为符合实际,则应用回归预测是有效的,否则就很难应用

注意事项

  • 为使回归方程较能符合实际,首先应尽可能定性判断自变量的可能种类和个数,并在观察事物发展规律的基础上定性判断回归方程的可能类型;其次,力求掌握较充分的高质量统计数据,再运用统计方法,利用数学工具和相关软件从定量方面计算或改进性判断

常用概念

实际值

  • 实际观测到的研究对象特征数据值

理论值

  • 根据实际值我们可以得到一条倾向线,用数学方法拟合这条曲线,可以得到数学模型,根据这个数学模型计算出来的、与实际值相对应的值,称为理论值

表示符号

一元线性回归

一元线性回归,就是只涉及一个自变量的回归;自变量和因变量之间的关系是线性关系的回归;因变量与自变量之间的关系用一条线性方程来表示的回归

方法步骤

 

回归问题分析的方法

  • 收集数据
  • 建立一个适合相关问题的回归函数
  • 通过学习已有的数据,对函数的未知参数进行估计
  • 回归方程及回归系数的显著性检验
  • 利用这个模型去预测/分类新的数据

回归分析的原理

  目的是为了找出一个最能够代表所有观测资料的函数,用这个函数来表示因变量与自变量的关系。回归的基本模型一般可以表示为:Y=f(X ,u),其中Y为因变量,X为自变量,u为未知参数

回归分析方法分类

  根据用途可以有多种分类,单变量的线性回归模型,多变量的线性回归模型,广义线性回归模型,概率单位回归模型,逻辑回归模型,曲线回归模型,岭回归模型,主成分回归模型等

原文地址:https://www.cnblogs.com/zhangzefei/p/9794445.html