多元线性回归分析
关键内容
第一节: 多元线性回归概念及统计描述
第二节: 多元线性回归假设检验
第三节、多元线性回归自变量 筛选
第四节: 多元线性回归应用
第五节: 多元线性回归应注意问题
第六节: 实例分析(SAS)
第一节: 多元线性回归概念及统计描述
概念: 用于分析一个连续型因变量与多个自变量之间 线性关系 统计学分析方法。
例: 血压值与年纪、性别、劳动强度、饮食习惯、吸烟情况、家族史
糖尿病人 血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂
多元线性回归数据结构
假定对n例观察对象逐一测定了因变量Y与m个自变量X1, X2,…Xm 数值。
━━━━━━━━━━━━━━━━━━━━━━
例号 X1 X2 … Xm Y
─────────────────────
1 X11 X12 … X1m Y1
2 X21 X22 … X2m Y2
3 ┆ ┆ … ┆ ┆
n Xn1 Xn2 … Xnm Yn
━━━━━━━━━━━━━━━━━━━━━━
多元线性回归模型
多元线性回归数学模型:
对应 由样本估量而得到 回归模型:
其中Ỷ表示Y 总体平均值 估量值, b0为常数项, 也称为截距,bi为Xi 偏回归系数, 表示当方程中其她自变量不变时, 自变量Xi改变一个计量单位, 反应变量Y 总体平均值 估量值改变 单位数.
标准化偏回归系数
因为各自变量都有各自 计量单位以及不一样 变异度, 所以不能直接用一般偏回归系数 大小来比较方程中各个自变量对反应变量Y 影响大小。需要求出标准化偏回归系数。
设: 与通常回归系数bi对应 标准化偏回归系数为Bi, 则
SXi、SY分别为Xi和Y 标准差。
偏回归系数 估量--最小二乘法
基础思想: 利用搜集到 因变量和自变量建立线性函数, 使得每一个实际测量 Yi与估量 Yi之间 离差 平方和尽可能 小。
只有一个自变量时, 回归结果为二维平面 一条直线, 而有两个自变量时, 结果为三维空间 一个平面, 有更多 自变量时, 回归 结果则是在三维以上空间 “超平面”, 无法直观图形表示, 只能想象。
多元线性回归分析前体条件——LINE
(1)linear : Y与X1, X2, …, Xm之间含有线性关系。
(2)independent :各个体观察值间相互独立。
(3)normal distribution :在一定范围内, 对任意一组自变量X1, X2, …, Xm值, Y都服从正态分布。
(4)equal variance :在一定范围内, 不一样组自变量对应 Y含有相同方差。
残差分析
经过残差分析能够深入了解实际资料是否符合回归模型假设(如正态、方差齐)
多元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.