一、主成分分析法的基本思想
主成分分析(ponent Analysis)是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部分信息,且所含的信息互不重叠。
采用这种方法可以将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的信息。
二、主成分分析法的数学模型
假设用p个变量来描述研究对象,分别用X1,X2…Xp来表示,这p个变量构成的p维随机向量为X=(X1,X2…Xp)。设随机向量X的均值为μ,协方差矩阵为Σ。对X进行线性变化,考虑原始变量的线性组合:
Z1=μ11X1+μ12X2+…μ1pXp
Z2=μ21X1+μ22X2+…μ2pXp
………………
Zp=μp1X1+μp2X2+…μppXp
主成分是不相关的线性组合Z1,Z2……Zp,并且Z1是X1,X2…Xp的线性组合中方差最大者,Z2是与Z1不相关的线性组合中方差最大者,…,Zp是与Z1,Z2 ……Zp-1都不相关的线性组合中方差最大者。
三、主成分分析法的基本步骤
第一步:设比较项目数为n,选取的指标数为p,则由项目的原始数据,可得矩阵X=(xij)m×p,其中xij表示第i项的第j项指标数据。
第二步:为了消除指标之间在量纲化和数量级上的差别,对指标数据进行标准化,得到标准化矩阵。
第三步:根据标准化数据矩阵建立协方差矩阵R,是反映标准化后的数据之间相关关系密切程度的统计指标值。统计指标值越大,说明有必要对数据进行主成分分析。其中,Rij(i,j=1,2,…,p)为原始变量Xi与Xj的相关系数。R为实对称矩阵,即Rij=Rji。只需计算其上三角元素或下三角元素即可,其计算公式为:
第四步:根据协方差矩阵R求出特征值、主成分贡献率和累计方差贡献率,确定主成分个数。解特征方程,求出特征值λi (i=1,2,…,p)。因为R是正定矩阵,所以其特征值
主成分分析法 来自淘豆网m.daumloan.com转载请标明出处.