第12章线性回归分析
本讲稿第一页,共七十页
主要内容★
1 一元线性回归的基本思路和步骤
2 多元线性回归
3 SPSS的线性回归操作
本讲稿第二页,共七十页
第一节 一元线性回归
本讲稿第三页,共七十页
均值之差 来表示。
本讲稿第二十一页,共七十页
变差的分解(图示)
x
y
y
{
}
}
本讲稿第二十二页,共七十页
离差平方和的分解 (三个平方和的意义)
总平方和(SST)
反映因变量的 n 个观察值与其均值的总离差;
回归平方和(SSR)
反映自变量 x 的变化对因变量 y 取值变化的影响,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和;
残差平方和(SSE)
反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和;
本讲稿第二十三页,共七十页
离差平方和的分解 (三个平方和的关系)
SST = SSR + SSE
总平方和
(SST)
{
回归平方和
(SSR)
残差平方和
(SSE)
{
{
本讲稿第二十四页,共七十页
判定系数R2 (coefficient of determination)
回归平方和占总离差平方和的比例
反映回归方程的拟合程度;
取值范围在 [ 0 , 1 ] 之间;
R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差;
一元线性回归中,判定系数等于y和x相关系数的平方,即R2=(r)2;
本讲稿第二十五页,共七十页
本讲稿第二十六页,共七十页
线性关系的检验
检验所有自变量与因变量之间的线性关系是否显著;
将均方回归 (MSR)同均方残差 (MSE)加以比较,应用F检验来分析二者之间的差别是否显著;
均方回归:回归平方和SSR除以相应的自由度(自变量的个数K) ;
均方残差:残差平方和SSE除以相应的自由度(n-k-1)。
本讲稿第二十七页,共七十页
线性关系的检验 (检验的步骤)
提出假设
H0:1=0 所有回归系数与零无显著差异,y与全体x的线性关系不显著
计算检验统计量F
确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F
作出决策:若F>F ,拒绝H0;若F<F ,不能拒绝H0
本讲稿第二十八页,共七十页
线性关系的检验 (sig值检验)
Sig值小于显著性水平a,拒绝零假设
认为所有回归系数与零存在显著差异,被解释变量y与解释变量x的线性关系显著,可以用线性模型描述它们之间的关系;
Sig值大于显著性水平a,不应拒绝零假设
说明用线性模型描述x和y之间的关系是不恰当的。
本讲稿第二十九页,共七十页
本讲稿第三十页,共七十页
检验回归方程中的每个解释变量x与被解释变量y之间是否存在显著的线性关系;
确定解释变量能否保留在线性回归方程中。
回归系数的显著性检验
本讲稿第三十一页,共七十页
回归系数的检验(样本统计量 的分布)
是根据最小二乘法求出的样本统计量,服从正态分布;
的分布具有如下性质
数学期望:
标准差:
由于未知,需用其估计量se来代替得到 的估计标准差
本讲稿第三十二页,共七十页
回归系数的检验 (检验步骤)
提出假设
H0: b1 = 0 (没有线性关系)
H1: b1 0 (有线性关系)
计算检验的统计量
确定显著性水平,并进行决策
t>t,拒绝H0; t<t,不能拒绝H0
Sig值小于a,拒绝H0
本讲稿第三十三页,共七十页
本讲稿第三十四页,共七十页
利用回归方程进行估计和预测
根据自变量 x 的取值估计或预测因变量 y的取值
估计或预测的类型
点估计
y 的平均值的点估计
y 的个别值的点估计
区间估计
y 的平均值的置信区间估计
y 的个别值的预测区间估计
本讲稿第三十五页,共七十页
第二节 多元线性回归
本讲稿第三十六页,共七十页
多元回归模型 (multiple regression model)
一个因变量与两个及两个以上自变量的回归;
描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xk 和误差项 的方程,称为多元回归模型;
涉及 p 个自变量的多元回归模型可表示为
b0 ,b1,b2 ,,bk是参数
是被称为误差项的随机变量
y 是x1,,x2 , ,xk 的线性函数加上误差项
是y不能被k个自变量的线性关系所解释的变异性
本讲稿第三十七页,共七十页
多元回归模型(基本假定)
误差项ε是一个期望值为0的随机变量
第12章线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.