第十二章
线性回归分析
医学科学研究中经常需要分析两个或两个以上变量之间的关系,如年龄与血压、体温与脉搏、胰岛素与血糖水平、毒剂剂量与动物的存活时间等等。
对这类客观事物或现象之间依存变化的数量关系,常用回归方法进行分析。
“回归”作为统计学的一个专用术语,最早来自英国人类学家Galton的“普用回归定律”,即“每个人的特征是和他的亲属共有的,但平均来说在程度上略差一点”。 为了证实这一定律,他的朋友Pearson收集了1078个家庭的身高、前臂长等指标的记录,发现:
历史背景:
儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:
。
也就是说,高个子父亲儿子的平均身高虽然比矮个子父亲儿子的平均身高要高一些,但稍矮于其父亲的平均身高;而矮个子父亲儿子的平均身高虽然比高个子父亲儿子的平均身高要矮一些,但高于其父亲的平均身高。
Galton将这种趋向于种族稳定的现象称之“回归”(regression)。
从此,“回归”逐渐发展成为分析两个变量或多个变量之间某种数量依存关系的一类统计方法。
第一节 两相关变量的散点图
为了直观地说明两相关变量的线性依存关系,用表12-1第(2)、(3)列中大白鼠的进食量和体重增加量的数据在坐标纸上描点,得图12-1所示的散点图(scatter plot)。
例12-1 用某饲料喂养12只大白鼠,得出大白鼠的进食量与体重增加量如表12-1,试绘制其散点图。
表12-1 12只大白鼠的进食量(g)与体重增加量(g)测量结果
线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.