第三章多元线性回归分析4
选择运输货物的次数x2,数据见15-2
模型设定为:
估计方程为:
二元回归模型
二、多元回归模型
基本概念
假定因变量y 与K个字变量x1,x2……-=
大学平均成绩决定模型
为了研究高中平均成绩(x1)及大学能力测验分数(x2)对大学学生平均成绩(y)的影响,从一所规模较大的大学抽取调查了141名学生,得到如下oLs估计的回归模型:
y=++
对参数如何解释?
首先β0===0时y的预测值
由于无人能在高中平均成绩为0及能力测验为0的情形下进入大学,所以截距β0本身无意义。
β1 =,表明二者之间存在局部正相关:
保持x2不变,如果x1提高1分,(注)
β2 =,虽然表明二者之间也存在局部正相关;且保持x1不变时,如果x2提高1分,大学平均成绩y平均会提高0. 0094分,但由于该值很小,说明与x1相比,其对大学成绩的影响很小,几乎可以忽略。(后面会用统计手段检验该系数不显著)
2. 参数估计量的性质
(1)线性性
(2)无偏性
(3) 最小方差性
估计量都是被解释变量观测值的线性组合
(1)线性性
(2)无偏性
(3)有效性(最小方差性)
高斯—马尔可夫定理:
若前述假定条件成立,OLS估计量是最佳线性无偏估计量。
得到样本回归方程
对每次观察值都能得到一个拟合值或预测值,对观察i, 其拟合值为:
残差
第三节 回归模型的统计检验
一、拟合优度检验
假设样本回归方程为
总平方和:
回归平方和:
剩余平方和:
自由度为n-k-1,反映样本观测值与估计值偏离的大小。
自由度为n-1,反映了样本观测值总体离差的大小
自由度为k ,k—自变量的个数,反映由模型中解释变量所解释的那部分离差的大小
可以证明 SST = RSS + ESS
1. 样本决定系数
意义:R2越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比越高。观察点在回归直线附近越密集。
决定系数要达到多大才算模型通过了检验,没有绝对的标准,要看具体情况而定。模型的拟合优度不是判断模型质量的唯一标准,有时甚至为了追求模型的经济意义,可以牺牲一点拟合优度。
大学平均成绩决定模型
y=++
R2=
Y--大学学生平均成绩
X1--高中平均成绩
X2--大学能力测验分数
X1 %,其余有其他因素解释。
2. 调整的决定系数
R2的大小受自变量 X 个数 的影响。可以证明,增加自变量 X 的个数,回归平方和增大,从而使得 R2增大。
由于增加自变量个数引起的 R2增大与拟合好坏无关,在含自变量个数 p 不同的模型之间比较拟合程度时,R2就不是一个合适的指标。
调整方法为:把残差平方和与总离差平方和之比的分子分母分别除以各自的自由度
性质:
的最小二乘估计
回归的标准误(standard error of
Theregression),是对影响y的不
可观测因素的标准误的估计,
反映了把x的影响排除以后y的
标准误.
可以证明 是无偏估计量.
用来反映因变量的实际值与估计值的平均变异程度的指标。该值越大,回归直线的精度越低;越小,回归直线的精度越高。当为0时,表示所有样本点都落在回归直线上
二 、方程显著性检验(F检验)
方程的显著性检验,旨在对模型中解释变量与被解释变量之间的线性关系在总体上是否显著成立作出推断。
在实际问题中,随机变量y与自变量xi之间究竟是否存在线性相关关系呢?如果无,则应有:
否则参数中至少有一个不为零,所以有必要对回归方程作显著性检验。即:
当我们拒绝假设时,则至少存在一个 ,即至少存在一个xi与y之间存在着线性相关关系。
检验步骤如下:
1、提出假设。
H1:βj 不全为 0 (j=0,1,2,…,k)
2、在 H0 成立条件下,F 统计量
由样本观测值,计算 F值。
3、给定显著性水平
第三章多元线性回归分析4 来自淘豆网m.daumloan.com转载请标明出处.