下载此文档

多元线性回归分析.doc


文档分类:高等教育 | 页数:约41页 举报非法文档有奖
1/41
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/41 下载此文档
文档列表 文档介绍
多元线性回归分析
直线回归概念复习
例:为了研究3岁至8岁男孩身高与年龄的规律,在某地区在3岁至8岁男孩中随机抽样,共分6个年龄层抽样:3岁,4岁,…,8岁,每个层抽10个男孩,共抽60个男孩。资料如下:
60个男孩的身高资料如下
年龄
3岁
4岁
5岁
6岁
7岁
8岁






























































平均身高






图1 某地男童身高与年龄的散点图
从散点图上,我们可以发现样本点(X,Y)随机地出现在一条直线附近,并且从资料背景上考察,同一年龄的儿童身高应近似服从一个正态分布,而儿童身高的总体均数应随着年龄增长而增大,并由每个年龄的身高样本均数与儿童年龄的散点图可以发现:这些点非常接近一条直线以及样本均数存在抽样误差,因此推测儿童身高的总体均数与年龄可能呈直线关系。故假定身高Y在年龄X点上的总体均数
与X呈直线关系。
其中y表示身高,x表示年龄。由于身高的总体均数与年龄有关,所以更准确地标记应为
表示在固定年龄情况下的身高总体均数。
身高的样本均数与年龄的散点图
故有理由认为身高的总体均数与年龄的关系可能是一条直线关系
上述公式称为直线回归方程。其中b为回归系数(regression coefficient),或称为斜率(slope);a称为常数项(constant),或称为截距(intercept)。回归系数
b表示x变化一个单位y平均变化b个单位。当x和y都是随机的,x、y间呈正相关时b>0,x、y间呈负相关时b<0,x、y间独立时b=0。
一般情况而言,参数a和b是未知的。对于本例而言,不同民族和不同地区,a和b往往是不同的,因此需要进行估计的。由于不同年龄的身高实际观察值应在对应的身高总体均数附近(即:实际观察值与总体均数之间仅存在个体变异的差异),故可以用年龄和实际身高观察值的资料对未知参数a和b进行估计,一般采用最小二乘法进行参数估计。我们将借助Stata软件对本例资料进行直线回归。
数据格式
x
y
3

3

3

3

3

3

3

3

3

3

4

4

4

4

4

4

4

4

4

4

5

5

5

5

5

5

5

5

5

5

6

6

6

6

6

6

6

6

6

6

7

7

7

7

7

7

7

7

7

7

8

8

8

8

8

8

8

8

8

8

回归命令
regress y x
Source | SS df MS Number of obs = 60
-------------+------------------------------ F( 1, 58) =
Mode

多元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数41
  • 收藏数0 收藏
  • 顶次数0
  • 上传人miaoshen1985
  • 文件大小1.11 MB
  • 时间2018-09-14
最近更新