c9回归分析-
什么是回归分析
回归:父母身高极端值时,孩子的身高未必极端,而是向中间收敛。
回归分析(regression analysis):就是用数学方程式来表达变量Y和X的这种不十分确定的共变关系,这一统计过程称为-。
系所解释的变异性
21
残差(Residual):e
22
总结:Y对X的回归
一元线性回归模型
预测方程(也称拟合方程)
如何计算?
回归截距
回归系数
23
二、最小二乘法 (概念要点)
使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即各点与该线的纵向距离最小。
用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。
24
最小二乘法(图示)
x
y
(xn , yn)
(x1 , y1)
(x2 , y2)
(xi , yi)
}
ei = yi-yi
^
25
回归方程 a与 b 值的几种情况:
X=0
26
三、总离差平方和的分解和显著性检验
27
数据总的变动称为总离差平方和,记为SST,它由两部分构成:
⑴被回归方程解释的部分,称回归平方和,
SSR, 也写可为SS回 ;
⑵未被回归方程解释的部分,称残差平方和,SSE,也写可为SS剩。
28
误差平方和
回归
平方和
总离差平方和
29
回归效果的显著性检验
可用F 检验来评价回归效果。检验的统计量为
统计假设:
H0: 回归方程中自变量回归系数为零,即b1=0
( 含义)
?
30
例:如资料中 x 对 y 的预测效果是否显著?
表1 某种护发产品1998年在8个地区销售的统计资料
计算 统计量的值,
查F 分布表,得 , 由于 F= ,故说明 y对 x的回归效果显著。
地 区 编 号
1 2 3 4 5 6 7 8
月平均销售收入(万元)y
31 40 30 34 25 20 35 40
月平均广告支出(万元)x
5 10 5 7 4 3 7 9
31
方差分析表
统计假设
回归方程
中所有自变量的
系数都为零
32
是相关系数的平方,用 表示;用来衡量回归方程对y的解释程度。
测定系数取值范围:
R2 越接近于1,表明x与y之间的相关性越强; 越接近于0,表明两个变量之间几乎没有直线相关关系.
测定系数
四、评价回归方程的指标:方程的拟合优度
33
测定系数与相关系数的区别:
① 防止相关系数的夸张;
② 可以直接表示x变量对回归的贡献大小(测定系数是某种意义上的相关系数)。
34
在总的离差平方和中,回归平方和所占比重越大,则线性回归效果就越好;
残差平方和所占比重越大,则线性回归效果越差。
测定系数,判定系数,样本决定系数,平方复相关系数,
可做回归值与实际观测值拟合程度的度量。
越接近1,说明二者的拟合程度越好。
当y 与 x为线性相关关系时,样本决定系数等于样本相关系数的平方,即
35
表2 10个家庭月收入与月消费支出统计资料(百元)
家庭编号 1 2 3 4 5 6 7 8 9 10
月收入 9 13 15 17 18 20 22 23 26 30
月消费支出 6 8 9 10 11 13 14 13 15 20
说明家庭月收入 x能很好的预测月消费支出y;
说明月收入可以预测月消费支出中96%的变异。
36
说明Y
c9回归分析- 来自淘豆网m.daumloan.com转载请标明出处.