: 函数关系:确定性关系相关关系:不确定性关系相关关系的测度:散点图线性相关关系的测度:: 回归这一术语最早来源于生物遗传学,由高尔顿( Francis Galton )引入。回归的现代解释:回归分析是研究某一变量(因变量)与另一个或多个变量( 解释变量、自变量) 之间的依存关系, 用解释变量的已知值或固定值来估计或预测因变量的总体平均值。因变量: Y 自变量: X或 X1 , X2 ,…等高尔顿的兴趣在于寻找为什么总体身高分布趋向稳定。现在我们所关心的已不是这个问题, 而是想知道在已知父亲身高的情况下, 儿子的身高的平均变化如何。换句话说, 就是已知父亲身高来预测儿子的平均身高。假设进行抽样试验,得以下结果: 父亲身高( X) 儿子身高( Y) X Y Y vs. X 假设进行多次抽样( 5次), 则对于同一个 X值, 会有多个 Y 值与之对应,即 Y 有多个取值。假设作出的散点图如下: X Y Y vs. X 为了找出 X与 Y 的关联关系, 一个自然的想法是取 X=Xi 时, 所有 Y 值的平均值作为对应 X=Xi 时 Y 的代表值,亦即取: 对于任何一个 X 的可能值 iX ,我们都可以相应的取: 当 X 变化时,上式左边是 X 的一个确定的函数,可以记为: 1 1 2 2 ( ) ( / ) ( ) ( / ) E Y E Y X X E Y E Y X X ? ?? ???( ) ( / ) i i E Y E Y X X ? ?( ) ( / ) ( ) i i i E Y E Y X X f X ? ??于是,我们可以用一个确定的函数来大体描述 Y与 X 之间的变化规律。为 Y对 X 的回归方程, 它反映了 X 固定的条件下 Y 的平均状态的变化情况。 Y对 X 的回归就是 Y对 X 的条件期望函数。。回归分析, 已如前述, 我们首先并不对这种度量有兴趣, 而主要是想根据一些有关变量的已知值来估计或预测某一变量的平均值。相关分析与回归分析在技术上的区别: 相关分析同等对待任何两个变量, 无自变量和因变量的区别。两个变量都假定为随机变量。回归分析对自变量和因变量不同对待。因变量是随机变量, 而自变量是非随机的,是给定(固定)变量。: 每一个条件均值 E( Y/X=Xi )( 简写为 E( Y/Xi )是 Xi 的一个( ) ( ) E Y f X ?( ) ( ) E Y f X ?( / ) ( ) i i E Y X f X ?函数,即: ( / ) ( ) i i E Y X f x ?( ) i f x :总体回归函数设(线性总体回归函数) 1b :截距( intercept ) 2b :斜率系数(slope) : 变量线性: 变量的幂指数为 1, 没有两个不同变量的乘除运算, 也没有自变量作为幂指数运用。参数线性:参数的幂指数为 1。线性回归一般指的是参数的线性, 而变量可能是线性, 也可能是非线性。: 设各个与其期望值的离差为: 即: :随机误差项,不可观察的随机变量,可以为正,也可为负。当时,则: 1 2 ( / ) ( ) i i i E Y X f X b b X ? ?? iY ( / ) i i i u Y E Y X ? ?( / ) i i i Y E Y X u ? ? iu 1 2 ( / ) i i E Y X b b
(重点)一元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.