12一般线性回归分析
结束对本章节的学习后,学员将可以:
◆解释什么是回归分析
◆进行一般线性回归分析与解释
●假设
●测定系数(R2与修正的R2)
●回归诊断
●置信区间
●有影响的12一般线性回归分析
结束对本章节的学习后,学员将可以:
◆解释什么是回归分析
◆进行一般线性回归分析与解释
●假设
●测定系数(R2与修正的R2)
●回归诊断
●置信区间
●有影响的观测数据
●估计标准误
学习目的
定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)
之间的统计关系的方法。
Y=f(X1,X2,…Xn)
回归分析
其中:
Y是响应变量
X1到Xn是因变量
11-2
定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。
也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变
量间的联系强度,在这里-1≤R≤1。
按照惯例,R表示真实的系数,R表示我们的最佳估算。
相关
^
回归分析
回归分析建立关于因变
量与响应变量之间关系
的估计方程式(公式)。
回归与相关
相关分析
量化两个变量之间的线性关系
的程度,即等式的适合性如何?
VS
11-3
◆预测
◆系统模型
◆因子筛选
◆参数估算
回归的应用
一般线性回归(SLR)数学模型
其中:
一般线性回归
Y-轴上的截取值
预测(独立)变量
Y
=
a+bX
斜率
是\响应(非独立)变量
11-4
最小平方的方法
残差(或误差)由e1=Yi-(a+bXi)表示。(观测值-拟合值)
最适合的直线即是残差平方和最小的那条线。
最小平方的方法
11-5
在Minitab中,可通过以下两种方法得到一般线性回归模型(最佳拟合线):
统计>回归>回归
统计>回归>拟合线图
例1B:拟合线图
例2:残差分析
从文件Oxygen purity中,建立Oxygen purity对Hydrocarbon%(X)之间
的一般线性回归模式并进行残差分析
11-9
例2:Minitab的残差图表
例2:Minitab的残差图表
11-10
随机
正态性
正态且均值为0
随机
置信区间
置信区间(CI)
◆对于一个给出的X,Y的平均值的分布区间。该区间在X=X处最窄:
X值离X越远其区间宽度越大。
预测区间(PI)
◆对于与一个给出的X值相应的个别的Y值的区间。由于其应用个体值,
该区间比置信区间宽。
例3
从文件Oxygen ,测定对已获得的线性回归模型的95%置信
区间和预测区间。
11-11
Minitab例3
Minitab统计→回归→拟合线图
例3:Minitab的CI—PI图
11-12
利用回归模型进行预测
我们可以预测两个数:
给出X值,预测y的均值uy
给出X值,预测y数值
我们不可以用此模型预测数据范围以
外的uy或y。此模型只是在数据范围内
才被验证为有效。
例4:预测
从文件Oxygen ,,确定uy和y的95%
区间。
11-13
例4:预测
Minitab统计→回归→回归
例4:Minitab输出
新观测值的预测值
新观家 拟合值
测值 拟合值 标准误 95%置信区间 95%预测区间
(,) (,)
新观测值的自变量值
新观
测值 Hydrocarbon%
1
11-14
具有影响的数据点
具有影响的数据点包括下列现象:
;
(也就是显著改变斜率或y轴截取值)
这些现象并不一定是坏现象,因此你不一定要删除他们。
不管怎样,并在分析回归结果之前应该识别
这些数据点并评估其影响。
具有影响的数据点
具有影响的数据可由于下列原因而被删除:
◆测量误差
◆数据输入误差
◆违反物理定律
包含明显的虚假值的回归方程式会被视为无效!
11-15
具有影响的数据现象:界外点
界外点
◆具有很大残差数值的现象数据。
具有影响
12一般线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.