第12章多元线性回归
一、多元线性回归概念: 多元线性回归是研究多个自变量与一个因变量间是否存在线性关系(相互依存关系),并用多元线性回归方程来表达这种关系。
多元线性回归的方程总体回归方程: β0常数项,β1 , …,βP 称为总体偏回归系数。
样本回归方程:
偏回归系数 B0为常数项,B1,B2,…,BP为样本偏回归系数,或称为Y对应于X1 ,X2 ,…,XP 的偏回归系数,偏回归系数表示假设在其他所有自变量不变的情况下,某一个自变量变化引起因变量Y变化的比率。
(血红蛋白)=β0 +β1 X1(钙Ca) +…+βP XP (铜Cu) + e
用途:1、用多元线性回归方程来描述多个自变量与因变量间的相互依存的数量关系。2、分析某些自变量对因变量的发生、发展及预后的影响程度。3、利用多元线性回归方程进行疾病的预测、预报,以及疾病诊断提高其诊断效果等。
例:安庆市1951-1971年6~8月降水及相关资料如下表,其中:
y:安庆市整个地区6~8月降水量(mm)。
X1:1月500hPa高度距平和。
X2:2~3月500hPa高度距平和。
X3:4月500hPa高度距平和。
X4:12月下旬一次年1月下旬地面WSW-WNW风速合计(m/s)。
试建立6~8月降水量最优的回归模型,并预测1971年6~8月降水量。
多元回归分析所要求的条件:1、因变量Y一定是服从正态分布的相互独立的随机变量2、自变量X可以是服从正态分布的随机变量,也可以是人为设定的。 3、当给定自变量的数值后,相应的Y值服从正态分布,其中心位置由决定:E=( |X1,X2,…,XP)= β0+β1 X1+…+βP XP+ e 4、一般样本含量要求是参与分析的变量(自变量+因变量)个数的5~10倍,对多元线性回归甚至要求20倍
例:,试分析extrusn,additive,gloss和opacity对tear_res的大小有无影响。
自变量可以是离散型变量,但应变量一定是连续型变量
4个变量全部进入分析,Enter法(系统默认)
相关系数矩阵
ch12多元回归 来自淘豆网m.daumloan.com转载请标明出处.