下载此文档

回归分析.pdf


文档分类:高等教育 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
: .

Scaling 过程,这些方法有其特定用途,不能随意使用。
鉴于 Logistic 模型在医学领域中的重要性,我们将在下一章对其作专门的介绍。非
线性回归和其他更复杂的回归过程也将在最后专章讲述,本章我们将讲述 Regression 菜
单中的线性回归和曲线拟和过程,尤其是前者将进行详细介绍。
§ Linear 过程
Linear 过程主要用于拟合多元线性回归模型,它和 Binary Logistic 过程是 Regression
菜单中使用频率最高的两个过程,这是因为线性回归模型在科研、生产工作中得到了广
泛的应用。不仅如此,该模型还起着全书承上启下的重要作用:前面讲过的方差分析模
型和相关分析和它有着极为密切的关系,而后面的 Logistic 回归、Cox 模型等又以它为基
础。因此,线性回归模型将作为这一章的重点来讲解:本节中将介绍其原理、对话框操
作和结果解释,下一节将对它进行深入的探讨。
线性回归模型简介
【概述】
比如我们收集了 20 名糖尿病人的血糖(y,mmol/L)、胰岛素(x1,mU/L)及生长素
(x2,μg/L)的数据,希望建立血糖浓度与胰岛素及生长素的多元线性回归方程,则实际
上拟合的模型如下:
yˆ = a + b1 x1 + b2 x2
这里, yˆ 称为 y 的估计值或预测值(predicted value),表示给定各自变量的值时,应
变量 y 的估计值;a 为截距(intercept),在回归方程中又称为常数项(constant),表示各自
变量均为 0 时 y 的估计值;bi 称为偏回归系数(partial regression coefficient),简称为回归
系数,表示其它自变量不变,xi 每改变一个单位时,我们所预测的 y 的平均变化量。比
如该方程中最终求得 b1=,则表示当胰岛素上升一个单位时,病人的血糖平均上升
个单位。
如果从个体的角度来看待线性回归模型,则上式可改写为如下形式:
yi = yˆ + ei = a + b1 x1i + b2 x2i + ei
其中 ei 为随机误差,被假定为服从均数为 0 的正态分布。即对每一个个体而言,在
知道了所有自变量取值时,我们能确定的只是应变量的平均取值,个体的具体取值在其
- 364 -硕士生《SPSS 统计分析》课程教学用资料
附近的一个范围内。而具体取值和平均取值间的差异(即 ei)被称为残差,这一部分变
异是当前模型力所不能及的部分。
大家如果已经学习了方差分析的有关章节,就会发现上面的模型公式其实和方
差分析模型公式是一回事。这并不奇怪,他们都属于一般线性模型,是同一片叶子的两
面而已。
既然模型中有无法消除的残差存在,采用初中学过的那种两点确定一条直线的方法
是无法求得方程中具体参数值了。由于方程应当和大多数点尽量靠近,从模型算得的预
测值应当就是总体中相应个体 y 值的均数,为此人们一般采用最小二乘法来拟合模型,
即保证各实测点至回归直线纵向距离的平方和为最小。如果采用此法拟合,则它和方差
分析模型完全等价。
【适用条件】
根据不同的分析目的,线性回归模型的适用条件会有所不同,这里我们给出的是基
本的适用条件。
— 线性趋势:自变量与应变量的关系是线性的,如果不是,则不能采用线性回归
来分析。这可以通过散点图来加以判断。
— 独立性:可表述为应变量 y 的取值相互独立,之间没有联系。反映到模型中,
实际上就是要求残差间相互独立,不存在自相关,否则应当采用自回归模型来

回归分析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wxc6688
  • 文件大小548 KB
  • 时间2022-05-12