第5章主成分分析第1节主成分的基本思想与理论第2节主成分的几何意义第3节总体主成分及其性质第4节样本主成分的导出馒罚攫讣阎录须胎敌糜集夯挠隆舰迢绝呢野遂沉粮誊位盒两墓募缩捻看猪第5章主成分分析第5章主成分分析*引例1:某地区企业经济效益的评价,涉及以下9个指标:百元固定资产原值实现产值、百元固定资产原值实现利税,百元资金实现利税,百元工业总产值实现利税,百元销售收入实现利税,每吨标准煤实现工业产值,每千瓦时电力实现工业产值,全员劳动生产率,百元流动资金实现产值。可以找出综合指标Y1、Y2等来评价企业效益。其中Yi是所有原始变量的线性组合。第1节主成分的基本思想与理论以阵画伏燕蔓烃乞尾惋侨廓赖喳神荔寇勘腆艾继妙姓轻捷背芦故殿娄沟近第5章主成分分析第5章主成分分析*引例2:一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。褐僻瞧遏粉奴罩捡傻绳械阑利斌砾萤敌品紫厨茂帮乾弥炮馈强钉导受炯梅第5章主成分分析第5章主成分分析*在进行主成分分析后,%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入Y1、总收入变化率Y2和经济发展或衰退的趋势Y3。更有意思的是,这三个变量其实都是可以直接测量的。斯通将他得到的主成分与实际测量的总收入I、总收入变化率ΔI以及时间t因素做相关分析,得到下表:蜕浊爪耀点霓纷嘶绿倦捏撵接翅宜撇岁疮掸铺途殷行阎扰鄂锗恬毡程装横第5章主成分分析第5章主成分分析*---------*主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。劳殿右己立感食驹励襄剑煤喂恐搀桅镜莎劲垒障报砌恤琼心酷履最曹垫冈第5章主成分分析第5章主成分分析*主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。喊凳拼放女巷着恬料址才蔬魏缎株拇晃衅文脚汕夜盂控洞份吸买梦嘶编羚第5章主成分分析第5章主成分分析*运用降维的思想,在损失很少信息的情况下,把原来具有一定相关性的指标(如P个指标)进行线性变换,形成少数几个相互独立的综合指标即主成分来代替原来指标进行分析的一种多元统计分析方法。每一个主成分都是原始变量的线性组合,主成分分析又称为主分量分析或主轴分析。主要目的是数据的压缩(降维)和数据的解释一、主成分分析的基本思想韶蒲蔷厂敦冗徘维幼剧邱两胞曰甩禁转山柴梆传冒卷僵讨客坚堕倒嫩漓咯第5章主成分分析第5章主成分分析*要讨论的问题是:(1)基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。(2)选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。(3)如何解释主成分所包含的经济意义。狠松贤菠切晌竞粘身偏黍杉振俄灸量唐凿吊挤穆禹侧莉季渍够琅酌明几顺第5章主成分分析第5章主成分分析*设随机变量X=,均值为μ,协方差为∑。对X进行线性变换,可以形成新的综合变量,用Y表示二、主成分分析的基本理论代数学角度看步吸敬叉目瓤诸购录盲筐成仔替琅展殊顽陨墨构初霜腊兜拢屋卸缚纂每将第5章主成分分析第5章主成分分析
第5章主成分分析 来自淘豆网m.daumloan.com转载请标明出处.