田玉慧
新乡医学院公共卫生学院
3831801
第十二章 简单回归分析
simple Regression analysis
整理课件
第一节 简单线性回归(Linear Regression)
一、线性回归的概念及量(mg/L)X:
, , , , , , ,
患病率(%)Y:
,, ,,,,,
整理课件
求直线回归方程:
,观察两变量间是否有直线趋势;
∑X、∑Y、∑X2、∑Y2、∑XY
∑X=、∑Y=
∑X2=、∑Y2=、∑XY=
3.
整理课件
,a:
b=lXY / lXX ==
a=-×=
故所求直线回归方程为:
:
在自变量范围内
取两点不能太近
整理课件
直线回归方程的图示
整理课件
四、总体回归系数 β的显著性检验
回归系数的检验即回归方程的检验,其目的是推断总体中X、Y两变量间是否存在直线回归关系。
因为,即使总体回归系数β=0,由于抽样误差的影响,b也可能不等于0,因此,需进行总体回归系数β是否为0的假设检验。
有2种方法:方差分析和t检验。
整理课件
直线回归的变异来源
p(x,y)
的分解图
(一)F 检验
整理课件
(一)F 检验
应变量y的总变异 ,由y与x间存在直线关系所引起的变异 ,与偏差 两部分构成,即:
上式两端平方,然后对所有的n点求和,则有
整理课件
离差平方和的分解 (三个平方和的关系)
2. 两端平方后求和有
从图上看有
SST = SSR + SSE
总变差平方和
(SST)
{
回归平方和
(SSR)
{
残差平方和
(SSE)
{
整理课件
直线回归的变异来源
p(x,y)
的分解图
(一)F 检验
整理课件
离差平方和的分解 (三个平方和的意义)
总平方和(SST)
反映因变量的 n 个观察值与其均值的总离差
回归平方和(SSR)
反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和
残差平方和(SSE)
反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和
整理课件
表明y的总平方和剖分为回归平方和与剩余平方和两部分。
要比较必需考虑自由度,上述3个平方和的自由度 的关系为:
总
=n-1 =1 = n-2
回
剩
整理课件
回归方程的显著性检验 (线性关系的检验 )
检验自变量和因变量之间的线性关系是否显著.
具体方法是将平均回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著性意义.
如果有显著性意义,两个变量之间存在线性关系
如果无显著性意义,两个变量之间不存在线性关系
整理课件
回归方程的显著性检验 (检验的步骤)
H0:线性关系不显著
2. 计算检验统计量F
确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F
作出决策:若FF ,拒绝H0;若F<F ,接受H0
整理课件
整理课件
例: 医生为了探讨缺碘地区母婴TSH(促甲状腺激素)水平的关系,随机抽取10对数据如下:
母血TSH水平
脐带血TSH水平
整理课件
① 由原始数据绘散点图
整理课件
将母血TSH水平作为自变量(independent variable),用 X表示,脐带血中TSH水平作为应变量(dependent variable),用 Y表示。脐带血TSH水平有随母血TSH水平增加而增大且呈直线趋势,但并非10个点子恰好全都在一直线上。
整理课件
② 计算回归方程 由前面已知:
b
《简单回归分析》 来自淘豆网m.daumloan.com转载请标明出处.