回归(regression)? Francis Golton (1822-1911)
大学数学实验•一般说来高个子的父代会有高个子的子代
•子代的身高比父代更加趋向一致(“向平庸的回归”)
Experiments in Mathematics
x ≈ 68, y ≈ 69
儿子比父亲平均高1英寸
对于身高72英寸的父亲,
实验12 回归分析 O 儿子身高多数不到73英寸;
对于身高64英寸的父亲,
清华大学数学科学系儿子身高多数超过65英寸;
回归直线 y= x+
Pearson: 1078个父亲和儿子身高的散点图
回归分析是数学建模的有力工具回归分析的主要步骤
•由于客观事物内部规律的复杂及人们认识程度的限制, •收集一组包含因变量和自变量的数据;
无法分析实际对象内在的因果关系; •选定因变量与自变量之间的模型,利用数据
•人们关心的变量(因变量)受另外几个变量(自变量)的关按照最小二乘准则计算模型中的系数;
联性(非因果性)的影响,并且存在众多随机因素,难以•利用统计分析方法对不同的模型进行比较,
用机理分析方法找出它们之间的关系; 找出与数据拟合得最好的模型;
•需要建立这些变量的数学模型,使得能够根据自变量•判断得到的模型是否适合于这组数据, 诊断
的数值预测因变量的大小,或者解释因变量的变化。有无不适合回归模型的异常数据;
血压与年龄刹车距离与车速•利用模型对因变量作出预测或解释。
薪金与资历、教育程度、工作岗位
回归分析(Regression Analysis) 实例及其数学模型例1 血压与年龄
为了解血压随年龄增长而升高的关系,调查了30个
成年人的血压(收缩压, )与年龄
•从应用角度介绍回归分析的 mmHg :
基本原理、方法和软件实现序号血压年龄序号血压年龄序号血压年龄
1 144 39 11 162 64 21 136 36
2 215 47 12 150 56 22 142 50
1. 简化的实际问题及其数学模型 3 138 45 13 140 59 23 120 39
4 145 47 14 110 34 24 120 21
2. 一元线性回归 5 162 65 15 128 42 25 160 44
3. 多元线性回归………………………
•用这组数据确定血压与年龄的关系;
4. 非线性回归
•从年龄预测血压可能的变化范围;
•回答“平均说来60岁比50岁的人血压高多少”。
1
例1 血压与年龄例2 血压与年龄、体重指数、吸烟血压(因变量) y,年龄(自变量) x, 又调查了例1中30个成年人的体重指数、吸烟习惯:
序血年体重吸序血年体重吸序血年体重吸
作数据(xi yi)(i=1,2,…30)的散点图号压龄指数烟号压龄指数烟号压龄指数烟
220
200 y与x大致呈线性关系 1 144 39 0 11 162 64 1 21 136 36 0
180
160 y = β0 + β1x 2 215 47 1 12 150 56 0 22 142 50
Exp12回归分析 来自淘豆网m.daumloan.com转载请标明出处.