题目: 主成分分析 PCA ponent Analysis 2内容?一、前言?二、问题的提出?三、主成分分析? 1. 二维数据的例子? 2. PCA 的几何意义? 3. 均值和协方差、特征值和特征向量? 4. PCA 的性质?四、主成分分析的算法?五、具体实例实例 2 ?六、结论七、练习 3 1. 前言?假定你是一个公司的财务经理,掌握了公司的所有数据,比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教育程度等等。?如果让你介绍公司状况,你能够把这些指标和数字都原封不动地摆出去吗? ?当然不能。实例 1 实例 2 ?你必须要把各个方面作出高度概括,用一两个指标简单明了地把情况说清楚。?汇报什么? 4 PCA ?多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性. ?在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的.?主成分分析原理: 是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。?主成分分析方法就是综合处理这种问题的一种强有力的方法。 5 (1) 如何作主成分分析? 当分析中所选择的变量具有不同的量纲, 变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。要讨论的问题是: 2. 问题的提出 6 各个变量之间差异很大 7 (2)如何选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。(3) 如何解释主成分所包含的几何意义或经济意义或其它。 8 美国的统计学家斯通(Stone) 在1947 年关于国民经济的研究是一项十分著名的工作。他曾利用美国 1929 一1938 年各年的数据,得到了 17 个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息、外贸平衡等等。?在进行主成分分析后,竟以 %的精度,用三个新变量就取代了原 17个变量。实例 1: 经济分析 9 根据经济学知识,斯通给这三个新变量分别命名为总收入 F1 、总收入变化率F2 和经济发展或衰退的趋势 F3 。更有意思的是,这三个变量其实都是可以直接测量的。 10 主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表进行最佳综合简化,也就是说, 对高维变量空间进行降维处理。很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。
主成分分析__原理 来自淘豆网m.daumloan.com转载请标明出处.