下载此文档

11回归分析.ppt


文档分类:高等教育 | 页数:约50页 举报非法文档有奖
1/50
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/50 下载此文档
文档列表 文档介绍
前几章的方法都只涉及一种变量,主要是比较它的各组值之间的差异。
对许多问题的研究需要考虑不只一个变量,例如生物的生长发育速度就与温度,营养,湿度……等许多因素有关,我们常常需要研究类似的多个变量之间的关系。这种关系可分为两大类,即相关关系与回归关系。
第五章回归分析
相关关系:两变量X,Y均为随机变量,任一变量的每一可能值都有另一变量的一个确定分布与之对应。
回归关系:X是非随机变量或随机变量,Y是随机变量,对X的每一确定值xi都有Y的一个确定分布与之对应。
相关关系/回归关系
从上述定义可看出相关关系中的两个变量地位是对称的,可以认为它们互为因果;而回归关系中则不是这样,我们常称回归关系中的X是自变量,而Y是因变量。即把X视为原因,而把Y视为结果。
两个变量地位
回归分析和相关分析的目的也有所不同。回归分析研究的重点是建立X与Y之间的数学关系式,这种关系式常常用于预测,即知道一个新的X取值,然后预测在此情况下的Y的取值;而相关分析的重点则放在研究X与Y两个随机变量之间的共同变化规律,例如当X增大时Y如何变化,以及这种共变关系的强弱。
目的也有所不同
从两个变量间相关(或回归)的程度来看,可分为以下三种情况:
(1)完全相关。此时一个变量的值确定后,另一个变量的值就可通过某种公式求出来;即一个变量的值可由另一个变量所完全决定。这种情况在生物学研究中是不太多见的。
(2)不相关。变量之间完全没有任何关系。此时知道一个变量的值不能提供有关另一个变量的任何信息。
(3)统计相关(不完全相关)。介于上述两种情况之间。也就是说,知道一个变量的值通过某种公式就可以提供关于另一个变量一些信息,通常情况下是提供有关另一个变量的均值的信息。此时知道一个变量的取值并不能完全决定另一个变量的取值,但可或多或少地决定它的分布。
两个变量间相关
按相关中涉及公式类型可把相关关系分为线性相关和非线性相关。在多数情况下,我们提到相关关系时都是指线性相关,这是因为线性相关的理论已经很完善,数学处理也很简单;而非线性问题则需要具体问题具体分析,常常没有什么好的解决方法,理论上能得到的结果也很有限。因此在一般情况下我们常常只能解决线性相关的问题
线性相关和非线性相关
回归关系就是对每一个X的取值xi,都有Y的一个分布与之对应。在这种情况下,怎么建立X与Y的关系呢?一个比较直观的想法就是建立X与Y的分布的参数间的关系,首先是与Y的均值的关系。这就是条件均值的概念,记为:
一元线性回归
在X=x1的条件下,求Y的均值。更一般地,我们用代表X取一切值时,Y的均值所构成的集合。所谓一元线性回归,就是假定X与之间的关系是线性关系,而且满足:

此时进行回归分析的目标就是给出参数α和β的估计值。
求Y的均值
对大白鼠从出生第6天起,每三天称一次体重,直到第18天。试计算日龄X与体重Y之间的回归方程。
序号
1
2
3
4
5
日龄xi
6
9
12
15
18
体重yi
11

22
26
29
计算日龄X与体重Y之间的回归
我们可以把数对(xi, yi)标在X-Y坐标系中,这种图称为散点图。它的优点是可以使我们对X、Y之间的关系有一个直观的、整体上的印象,如它们是否有某种规律性,是接近一条直线还是一条曲线,等等。我们还可以画很多条接近这些点的直线或曲线,但这些线中的哪一条可以最好地代表X, Y之间的关系,就不是凭直观印象可以做出判断的了
散点图

11回归分析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数50
  • 收藏数0 收藏
  • 顶次数0
  • 上传人中国课件站
  • 文件大小0 KB
  • 时间2011-12-04
最近更新