第3章回归分析
1
“回归”(regression)是由英国著名生物学家兼统计学家高尔顿(Francis Galton)在研究人类遗传问题时提出来的。为了研究父代与子代身高的关系,高尔顿搜集了1078对父亲及其儿子的身高数据,他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。
高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现象—回归效应。当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更矮的概率;父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律,即这两种身高(父亲的身高和儿子的身高)有向他们父辈的平均身高回归的趋势。对于这个一般结论的解释是:大自然具有一种约束力,使人类身高的分布相对稳定而不产生两极分化,这就是所谓的回归效应。
2
第一节一元线性回归模型
3
回归分析主要是研究如何根据自变量X的已知值来估计或预测因变量Y的值;
回归分析和相关分析都是对多个变量之间依存关系的分析。只有存在相关的变量才能进行回归分析,相关程度愈高,回归效果越好。
相关分析与回归分析的不同点:
相关分析是研究变量之间的依存关系,但不区分哪个是自变量,哪个是因变量;而回归分析不仅研究变量之间的依存关系,而且要根据研究对象和目的,确定哪个是自变量(解释变量),哪个是因变量(被解释变量);
相关分析主要是研究变量之间关系的密切程度和变化的方向;而回归分析要通过建立回归模型和控制自变量来进行估计和预测。
4
一、一元线性回归模型的基本概念
若有两个变量x和y,其中x为非随机变量(即可控变量),y为随机变量。且x和y有相关关系,则可用数学模型 y=f(x)+e 近似地表示它们之间的关系。式中e是随机变量。
回归方程(回归模型)
若一元回归方程是线性的,称为一元线性回归。其数学模型为:
这个回归模型中的随机误差,要求满足如下的高斯基本假设:
5
6
二、一元线性回归模型的参数估计
7
上式的进一步求解:
8
总离差的分解
9
10
定量分析方法之回归分析 来自淘豆网m.daumloan.com转载请标明出处.