多元线性回归分析主要内容第一节:多元线性回归概念及统计描述第二节:多元线性回归假设检验第三节、多元线性回归自变量的筛选第四节:多元线性回归应用第五节:多元线性回归应注意问题第六节:实例分析(SAS)第一节:多元线性回归概念及统计描述概念:用于分析一个连续型因变量与多个自变量之间的线性关系的统计学分析方法。例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂多元线性回归数据结构假定对n例观察对象逐一测定了因变量Y与m个自变量X1,X2,…Xm的数值。━━━━━━━━━━━━━━━━━━━━━━例号X1X2…XmY─────────────────────1X11X12…X1mY12X21X22…X2mY23┆┆…┆┆nXn1Xn2…XnmYn━━━━━━━━━━━━━━━━━━━━━━多元线性回归模型多元线性回归数学模型:相应的由样本估计而得到的回归模型:其中Ỷ表示Y的总体平均值的估计值,b0为常数项,也称为截距,bi为Xi的偏回归系数,表示当方程中其他自变量不变时,自变量Xi变化一个计量单位,,所以不能直接用普通偏回归系数的大小来比较方程中各个自变量对反应变量Y的影响大小。需要求出标准化偏回归系数。设:与一般回归系数bi对应的标准化偏回归系数为Bi,则SXi、SY分别为Xi和Y的标准差。偏回归系数的估计--最小二乘法基本思想:利用收集到的因变量和自变量建立线性函数,使得每一个实际测量的Yi与估计的Yi之间的离差的平方和尽可能的小。只有一个自变量时,回归结果为二维平面的一条直线,而有两个自变量时,结果为三维空间的一个平面,有更多的自变量时,回归的结果则是在三维以上空间的“超平面”,无法直观图形表达,只能想象。多元线性回归分析前体条件——LINE(1)linear:Y与X1,X2,…,Xm之间具有线性关系。(2)independent:各个体观测值间相互独立。(3)normaldistribution:在一定范围内,对任意一组自变量X1,X2,…,Xm值,Y都服从正态分布。(4)equalvariance:在一定范围内,不同组自变量对应的Y具有相同方差。残差分析通过残差分析可以深入了解实际资料是否符合回归模型假设(如正态、方差齐)
多元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.