多元线性回归分析
第一页,共55页
人的体重与身高、胸围
血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史
糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂
射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、 照射的时间
一个变量的变化直接与另一组变量的变化有关:
如:
第二页,共55页
Multivariate linear regression
概念:
多元线性回归分析也称复线性回归分析(multiple linear regression analysis),它研究一组自变量如何直接影响一个因变量。
自变量(independent variable)是指独立自由变量的变量,用向量X表示;因变量(dependent variable)是指非独立的、受其它变量影响的变量,用向量Y表示;由于模型仅涉及一个因变量,所以多元线性回归分析也称单变量线性回归分析(univariate linear regression analysis)
第三页,共55页
多元回归分析数据格式
第四页,共55页
假定因变量Y与自变量 间存在如下关系:
式中, 是常数项, 称为偏回归系数(partial regression coefficient)。 的含义为在其它自变量保持不变的条件下,自变量 改变一个单位时因变量Y 的平均改变量。 为随机误差,又称残差(residual),它表示 的变化中不能由自变量 解释的部分。
一、多元线性回归方程模型
第五页,共55页
x1
x2
y
第六页,共55页
应用条件:
注意:虽然模型要求因变量是连续数值变量,但对自变量的类型不限。若自变量是分类变量,特别是无序分类变量,要转化为亚变量才能分析。对于自变量是分类变量的情形,需要用广义线性回归模型分析。
第七页,共55页
二、多元线性回归分析的步骤
(一)估计各项参数,建立多元线性回归方程模型
(二)对整个模型进行假设检验,模型有意义的前提下,再分别对各偏回归系数进行假设检验。
(三)计算相应指标,对模型的拟合效果进行评价。
第八页,共55页
(一)模型的参数估计
第九页,共55页
27名糖尿病患者的血清总胆固醇(x1)、甘油三酯(x2)、空腹胰岛素(x3)、糖化血红蛋白(x4)、空腹血糖(y)的测量值列于表中,试建立血糖与其它几项指标关系的多元线性回归方程。
第十页,共55页
多元线性回归分析 (2) 来自淘豆网m.daumloan.com转载请标明出处.