下载此文档

多元统计分析——主成分分析.ppt


文档分类:高等教育 | 页数:约56页 举报非法文档有奖
1/56
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/56 下载此文档
文档列表 文档介绍
第5章主成分分析
第1节主成分的基本思想与理论
第2节主成分的几何意义
第3节总体主成分及其性质
第4节样本主成分的导出
1
引例1:某地区企业经济效益的评价,涉及以下9个指标:百元固定资产原值实现产值、百元固定资产原值实现利税,百元资金实现利税,百元工业总产值实现利税,百元销售收入实现利税,每吨标准煤实现工业产值,每千瓦时电力实现工业产值,全员劳动生产率,百元流动资金实现产值。
可以找出综合指标Y1、Y2等来评价企业效益。其中Yi是所有原始变量的线性组合。
第1节主成分的基本思想与理论
2
引例2:
一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。
3
在进行主成分分析后,%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入Y1、总收入变化率Y2和经济发展或衰退的趋势Y3。更有意思的是,这三个变量其实都是可以直接测量的。斯通将他得到的主成分与实际测量的总收入I、总收入变化率ΔI以及时间t因素做相关分析,得到下表:
4
Y1
Y2
Y3
i
Δi
t
Y1
1
Y2
0
1
Y3
0
0
1
i

-

1
Δi
-

-
-
1
t
-
-
-
-
-
1
5
主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。
在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。
6
主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。
很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。
7
运用降维的思想,在损失很少信息的情况下,把原来具有一定相关性的指标(如P个指标)进行线性变换,形成少数几个相互独立的综合指标即主成分来代替原来指标进行分析的一种多元统计分析方法。
每一个主成分都是原始变量的线性组合,
主成分分析又称为主分量分析或主轴分析。
主要目的是数据的压缩(降维)和数据的解释
一、主成分分析的基本思想
8
要讨论的问题是:
(1) 基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。
(2) 选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。
(3)如何解释主成分所包含的经济意义。
9
设随机变量X= ,均值为μ,协方差为∑。对X进行线性变换,可以形成新的综合变量,用Y表示
二、主成分分析的基本理论
代数学角度看
10

多元统计分析——主成分分析 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数56
  • 收藏数0 收藏
  • 顶次数0
  • 上传人yzhluyin1
  • 文件大小760 KB
  • 时间2017-10-12