(三)
高二数学选修2-3 第三章统计案例
复习回顾
1、线性回归模型:
y=bx+a+e, (3)
其中a和b为模型的未知参数,e称为随机误差。
y=bx+a+e,
E(e)=0,D(e)= (4)
2、数据点和它在回归直线上相应位置的差异是随机误差的效应,称为残差。
3、称为残差平方和,它代表了随机误差的效应。
表示总的效应,称为总偏差平方和。
回归平方和
4、两个指标:
(1)类比样本方差估计总体方差的思想,可以用作
为的估计量, 越小,预报精度越高。
(2)我们可以用相关指数R2来刻画回归的效果,其
计算公式是:
R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差。
1、坐标纵轴为残差变量,横轴可以有不同的选择;
2、若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;
3、对于远离横轴的点,要特别注意。
身高与体重残差图
异常点
6、一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。
(2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).
(4)按一定规则估计回归方程中的参数(如最小二乘法)。
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。
练习假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。
使用年限x
2
3
4
5
6
维修费用y
若由资料知,y对x呈线性相关关系。试求:
(1)线性回归方程的回归系数;
(2)求残差平方和;
(3)求相关系数;
(4)估计使用年限为10年时,维修费用是多少?
解:
(1)由已知数据制成表格。
1
2
3
4
5
合计
2
3
4
5
6
20
25
4
9
16
25
36
90
所以有
(4)x=10时, y=(万元)
案例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中:
(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。
(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?
温度xoC
21
23
25
27
29
32
35
产卵数y/个
7
11
21
24
66
115
325
选变量
解:选取气温为解释变量x,产卵数
为预报变量y。
画散点图
假设线性回归方程为:ŷ=bx+a
选模型
分析和预测
当x=28时,y =×28-≈ 93
估计参数
由计算器得:线性回归方程为y=-
相关指数R2≈=
所以,%的产卵数变化。
探索
0
50
100
150
200
250
300
350
0
3
6
9
12
15
18
21
24
27
30
33
36
39
方案1
当x=28时,y =×28-≈ 93
一元线性模型
奇怪?
93>66 ?
模型不好?
回归分析3 来自淘豆网m.daumloan.com转载请标明出处.