主成分分析方法
主成分分析的基本原理
主成分分析的计算步骤
主成分分析方法应用实例
主成分分析
( ponents Analysis)
是由Hotelling于1933年首先提出的,
它是利用降维的思想,把多指标转化
为少数几个综合指标的多元统计分析
方法。
从数学角度来看,这是一种降维处理
技术。
主成分分析的目的与功能
在多变量分析中,分析者所面临的最大难题是解决众多变量之间的关系问题。进行数据降维可以用尽可能少的新指标取代原来较多的指标变量,并能包含原来指标变量所包含的大部分信息。
解决多元回归分析中的多重共线性问题。
综合评价中,人们总是尽可能多地选取评价指标,而这些评价指标之间往往相互重叠,信息冗余是不可避免的。主成分分析则可以把这众多指标所蕴含的信息压缩到少数几个主成分指标,然后给出这几个主成分指标的权重,综合到一个评价指标中。
主成分的主要功能
数据降维(Dimension Reduction)
变量筛选(Variables Screening)
一、数据处理
采集m维随机向量x=(x1,x2,…,xm)T的n个样品xi=(xi1,xi2,…,xim)T, i=1,2, …,n, n>m,构造样本阵X
x1T x11 x12 ┅ x1m
x2T x21 x22 ┅ x2m
X= ┇= ┇┇┇
xnT xn1 xn2 ┅ xnm
x ij , 对正指标
Y ij =
- x ij, 对逆指标
得
Y= Y ij n×p
2 对Y中元进行如下标准化变换
其中
得标准化矩阵Z:
Z=
z1T z11 z12 ┅ z1m
z2T = z21 z22 ┅ z2m
┇┇┇┇
znT zn1 zn2 ┅ znm
一、主成分分析的基本原理
假定有n个样本,每个样本共有m个变量,构成一个n×m阶的数据矩阵(标准化后的数据)
()
当m较大时,在m维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。
定义:记x1,x2,…,xm为原变量指标,F1,F2,…,Fp(p≤m)为新变量指标
()
系数eij的确定原则:
① Fi与Fj(i≠j;i,j=1,2,…,p)相互无关;
主成分分析方法 来自淘豆网m.daumloan.com转载请标明出处.