第十四章直线回归分析第十三章介绍的相关系数可用来说明两变量之间相伴随而呈线性变化的趋势和关联强度,并不能用其中一个变量来预测另一个变量的值。在实际工作中,研究者常常需要通过易测的变量对另一难测的变量进行估测,如用腰围、臀围、体重指数(BMI)等简易体脂参数来估测腹腔内脂肪含量,此时可采用回归分析。本章仅介绍最简单的直线回归分析。第一节直线回归方程的建立一、直线回归的概念直线回归(linearregression)方法可用来研究两个连续型变量之间数量上的线性依存关系,也称简单回归(simpleregression)。在回归分析中估测的随机变量称为因变量(dependentvariable)或反应变量(responsevariable),常用表示;所依存的变量称为自变量(independentvariable)或解释变量(explanatoryvariable),常用x表示。,对20名男性志愿受试者测量其腰围(cm),并采用磁共振成像法测量其腹腔内脂肪面积(cm2),。试建立腹腔内脂肪面积()和腰围()的直线回归方程。(cm)腹腔内脂肪面积(cm2)(cm2)腰围(cm)以腰围为横坐标,腹腔内脂肪面积为纵坐标绘制散点图,,可见散点大致呈直线趋势。,这样的直线称为回归直线。通常用来表示回归直线上各点的纵坐标,其数值是当取某一值时因变量的平均估计值。与单变量问题类似,由于个体观察值不一定总等于其均数,所以散点图中各点不会恰好都在回归直线上,故两变量的直线关系并非是一一对应的函数关系。描述随的变化而变化的方程称为直线回归方程(linearregressionequation),也称为直线回归模型,可表示为()式中,a为回归直线的截距(intercept)或常数项,表示等于0时,的平均估计值;b为回归直线的斜率(slope)或回归系数(regressioncoefficient),表示改变一个单位时的平均改变量。,表示回归直线从左下方走向右上方,即y随x增大而增大;,表示回归直线从左上方走向右下方,即y随x增大而减小;,表示回归直线平行于x轴,即y与x无线性依存关系。由此可见,直线回归就是通过回归系数与自变量的线性组合来描述因变量的均数是如何随自变量的改变而变化。二、回归方程的估计(一)回归方程估计的最小二乘法从散点图来看,不同的a和b对应于不同的直线,求解a、b实际上就是如何能合理地找到一条能最好的代表数据点分布趋势的直线,使得每个实测值与这条“理想”的回归直线的估计值最接近。由于各点的()有正有负,故通常取()平方和最小,统计学上将各点距回归直线的纵向距离平方和最小这一原则称为最小二乘法(leastsquaremethod)。(二)回归系数的估计方法按照最小二乘法,当取得最小值时所对应a和b的计算公式如下:()()式中为与的离均差交叉乘积和,简称离均差积和,可按公式()计算:()。,,观察到二者存在直线趋势,故可进行直线回归分析。:,()可得,由式()可得,:在的实测值范围内,任取相距较远且易读数的两个值,代入方程得到两个值,连接两点即可绘制回归直线。本例分别取值79和88,,连接点(79,)和(88,)即得回归直线。第二节直线回归的统计推断一、总体回归系数的假设检验类似单变量问题中常需用样本均数对总体均数进行推断,在得到样本回归方程后,研究者还需推断相应总体中这种回归关系是否确实存在,也即推断的总体条件均数是否随的变化而呈线性变化。总体回归方程形式如下:()式中,和是前述a和b所对应的总体参数;为对应于各值的的总体均数,即总体条件均数;为误差项或残差。由式()可见,当总体回归系数时,的总体均数为常
直线回归分析直线回归分析介绍的相关 来自淘豆网m.daumloan.com转载请标明出处.