下载此文档

多元线性回归分析正式.ppt


文档分类:高等教育 | 页数:约59页 举报非法文档有奖
1/59
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/59 下载此文档
文档列表 文档介绍
多元线性回归分析正式
现在学习的是第1页,共59页
讲课内容
第一节 多元线性回归(重点)
第二节 自变量选择方法(重点)
第三节 多元线性回归的应用及注
意事项
现在学习的是第2页,共59页9页

Y与多个自变量间的线性相关程度;
Y与估计值 间的Pearson相关系数r。
现在学习的是第24页,共59页
(二)各自变量的假设检验及评价

表示模型中含有其它m-1个自变量的条
件下该自变量对Y的回归贡献。其值愈
大说明相应的自变量愈重要。
现在学习的是第25页,共59页
现在学习的是第26页,共59页
+++≠
现在学习的是第27页,共59页
胰岛素(X3)与糖化血红蛋白(X4)与血糖(Y)有线性回归关系。
现在学习的是第28页,共59页

现在学习的是第29页,共59页
胰岛素(X3)与糖化血红蛋白(X4)与血糖(Y)有线性回归关系。
现在学习的是第30页,共59页
标准化回归系数bj’ 的绝对值用来比较各个自变量Xj 对Y的影响程度大小;绝对值越大影响越大。标准化回归方程的截距为0。

标准化回归系数与一般回归方程的回归系
数的关系:
标准化回归方程
现在学习的是第31页,共59页
对血糖影响大小的顺序依次为糖化血红蛋白(X4)、胰岛素(X3)、甘油三酯(X2)与总胆固醇 (X1)。胰岛素为负向影响。
现在学习的是第32页,共59页
第二节 自变量选择方法
现在学习的是第33页,共59页
一、全局选择法
对自变量各种不同的组合所建立的回归方程进行比较,从全部组合中挑出一个“最优”的回归方程。
现在学习的是第34页,共59页
R2可用来评价回归方程优劣。
随着自变量增加,R2不断增大,对两个不
同个数自变量回归方程比较,须考虑方程
包含自变量个数影响,应对R2进行校正。
所谓“最优”回归方程指 最大者。
选择法
现在学习的是第35页,共59页
P为方程中自变量个数。
最优方程的Cp期望值是p+1。
应选择Cp最接近P+1的回归方程为最优。
2. 选择法
现在学习的是第36页,共59页
现在学习的是第37页,共59页
二、逐步选择法
全局选择计算量很大:
6个变量,计算26-1=63个方程;
10个变量,计算210-1=1023个方程。
按选入变量顺序不同分前进法、后退法
与逐步回归法,共同特点是每一步只引
入或剔除一个自变量Xj。
现在学习的是第38页,共59页
对Xj的取舍要进行F检验:
计算进行到第l步时:
p :方程中自变量个数
SS回:Xj的偏回归平方和
SS残:残差平方和
现在学习的是第39页,共59页
(只选不剔)
开始方程中无自变量,然后从方程外选取偏
回归平方和最大的自变量作F检验以决定是否选入方程,直至无自变量可以引入方程为止。
缺点:后续变量的引入可能使先前引入的变
   量变的不重要。
Xj入选
现在学习的是第40页,共59页
(只剔不选)
开始方程中包含全部自变量,然后从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除,直至无自变量可以从方程中剔除为止。
缺点:当某些自变量高度相关时,可能得不
出正确结果。
Xj剔除
现在学习的是第41页,共59页
(先选后剔,双向筛选)
开始方程中无自变量,从方程外选取偏回归平方和最大的自变量作F检验以决定是否选入方程;
每引一个自变量进入方程后,从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除;
直至方程外无自变量可引入,方程内无自变量可剔除为止。
现在学习的是第42页,共59页
Xj剔除
内剔
Xj入选
外引
α入值定的越小选取自变量标准越严,被选
入方程内自变量数越少。 α入值越大则反之。
小样本:α入=,α出=。
大样本:α入=,α出=。
α入<α出,以免Xj上一步剔除后下一步又被选入
现在学习的是第43页,共59页
选X4前先建立4个直线回归方程;
选X1前先建立1个含3个自变量、 3个含2个
自变量的多元线性回归方程。
现在学习的是第44页,共59页
现在学习的是第45页,共59页
现在学习的是第46页,共59页

多元线性回归分析正式 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数59
  • 收藏数0 收藏
  • 顶次数0
  • 上传人文库新人
  • 文件大小2.82 MB
  • 时间2022-03-14