下载此文档

主成分分析__原理.ppt


文档分类:高等教育 | 页数:约56页 举报非法文档有奖
1/56
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/56 下载此文档
文档列表 文档介绍
题目: 主成分分析 PCA
ponent Analysis
1
内容
一、前言
二、问题的提出
三、主成分分析
1. 二维数据的例子
2. PCA的几何意义
3. 均值和协方差、特征值和特征向量
4. PCA的性质
四、主成分分析的算法
五、具体实例实例2
六、结论
七、练习
2
1. 前言
假定你是一个公司的财务经理,掌握了公司的所有数据,比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教育程度等等。
如果让你介绍公司状况,你能够把这些指标和数字都原封不动地摆出去吗?
当然不能。实例1 实例2
你必须要把各个方面作出高度概括,用一两个指标简单明了地把情况说清楚。
汇报什么?
3
PCA
多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性.
在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的.
主成分分析原理: 是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。
主成分分析方法就是综合处理这种问题的一种强有力的方法。
4
(1) 如何作主成分分析?
当分析中所选择的变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。
在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。要讨论的问题是:
2. 问题的提出
5
各个变量之间差异很大
6
(2) 如何选择几个主成分。
主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。
(3)如何解释主成分所包含的几何意义或经济意义或其它。
7
美国的统计学家斯通(Stone)在1947年关于国民经济的研究是一项十分著名的工作。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息、外贸平衡等等。
在进行主成分分析后,%的精度,用三个新变量就取代了原17个变量。
实例1: 经济分析
8
根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是,这三个变量其实都是可以直接测量的。
9
主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。
很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。
10

主成分分析__原理 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数56
  • 收藏数0 收藏
  • 顶次数0
  • 上传人q1188830
  • 文件大小0 KB
  • 时间2015-12-18
最近更新