统计分析 主成分分析
第一页,共26页
问题的提出
主成分分析方法(principal component analysis,PCA )就是综合处理这种问题的一种强有力的工具。它把原来多个变量(显式变量)转化为少数几个综合变量(潜式变量)。综合变量即主成分(principal compontent)综合变量之间相互独立,且能反映原来多个变量的大部分信息。
主成分分析采用的主要原则是使方差最大,以期尽可能多的保留原有变量所包含的信息,同时又能用尽可能少的主成分替代原有变量,从而使问题变的简便。
但是,这些主成分通常并没有明确的专业意义。因子分析是主成分分析的一种推广。它从一定的模型出发,找出几个反映原有变量的公共因子,并力求使之有较为合理的专业解释。
§8 主成分分析
第二页,共26页
§8 主成分分析
问题的提出
[引例8-1] 2000年全国各地
区经济效益主要指标有以下
8个:GDP(亿元)、工业
增加值(%)、总资产贡
献率(%)、资产负债率
(%)、流动资产周转次
数(次/年)、工业成本费
用利润率(%)、全员劳动
生产率(元/)、产品
销售率(%)。
第三页,共26页
§8 主成分分析
第四页,共26页
§8 主成分分析
问题的提出
第五页,共26页
§8 主成分分析
问题的提出
第六页,共26页
§8 主成分分析
什么是主成分分析
主成分分析的数学模型
主成分分析的主要步骤
如何在SPSS软件中进行主成分分析
第七页,共26页
§8 主成分分析
什么是主成分分析
主成分概念首先由Kal parson在1901年提出,不过当时
只对非随机变量来讨论的。1933年Hotelling将这个概念推
广到随机向量。
主成分分析(Principal Components Analysis ,PCA)也
称为主分量分析,是一种通过降维来简化数据结构的方
法,即如何把多个变量(变量)转化为少数几个综合变量
(综合变量),而这几个综合变量可以反映原来多个变量
的大部分信息。
为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。
第八页,共26页
§8 主成分分析
什么是主成分分析
在实际问题中,经常遇到多变量(指标)问题,而且变量之间有一定的相关性。变量多且变量间有一定的相关性,势必增加了分析问题的复杂性。
主成分分析就是设法将原来变量重新组合成一组新的互相无关的几个综合变量来代替原来变量,同时根据实际需要从中可取几个较少的综合变量尽可能多地反映原来变量的信息。
第九页,共26页
§8 主成分分析
基本思想
主成分分析就是设法将原来众多具有一定相关性的变量(如p个变量),重新组合成一组新的相互无关的综合变量来代替原来变量。怎么处理?
通常数学上的处理就是将原来p个变量作线性组合作为新的综合变量。如何选择?
如果将选取的第一个线性组合即第一个综合变量记为F1,自然希望F1尽可能多的反映原来变量的信息。怎样反映?
最经典的方法就是用方差来表达,即var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称之为第一主成分(principal component I)。
第十页,共26页
统计分析 主成分分析 来自淘豆网m.daumloan.com转载请标明出处.