主成分分析法
概念:把原来多个变量划为少数几个综合指标的一种统计分析方法,是一种降维处理技术.
主成分分析法
一个研究对象,往往是多要素的复杂系统。变量太多无疑会增加分析问题的难度和复杂性,利用原变量之间的相关关系,用较少的新变量代替原来较多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这样问题就简单化了。
研究对象
指标
x1 x2 … xj … xp
1
2
…
i
…
n
x11 x12 … x1j … x1p
x21 x22 … x2j … x2p
………………
xi1 xi2 … xij … xip
………………
xn1 xn2 … xnj … xnp
假设有n个对象,每一个对象都有x1,x2,…,xp个指标构成,它们所对应的要素数据用下表给出:
一、基本原理
原变量为x1,x2,…,xp,降维处理后,设它们的综合指标,即新变量为z1,z2,z3,…,zm(m≤p),则
z1称为原变量x1,x2,…,xp的第一主成分
Z2称为原变量x1,x2,…,xp的第二主成分
……………..
zm称为原变量x1,x2,…,xp的第m主成分
找主成分zi就是要确定系数lij。从数学上知道,它们分别是x1,x2,…,xp的相关系数矩阵的m个较大的特征值所对应的特征向量。
二、主成分分析的计算步骤
相关系数计算公式
1、计算相关系数
据公式得这p个变量之间的相关系数矩阵为
主成分zi的贡献率为
前i个主成分的累计贡献率为
3、计算主成分贡献率及累计贡献率
当前 i个主成分累计贡献率达到85%——95%,就取前i个主成分作为新变量。
4、计算主成分载荷
计算公式为
得前i个主成分在原变量上的载荷
原变量xi
主成分
Z1
Z2
…
Zi
x1
x2
…
xp
l11
l12
…
l1p
l21
l22
…
l2p
…
…
…
…
li1
li2
…
lip
三、主成分分析方法的SPSS实现
对45个城市7项经济指标进行主成分分析
1、数据导入到数据窗口中,定义各变量,确保各变量均为数值型。
2、激活Analysis 菜单选Data Reduction 的Factor...命令项,弹出Factor Analysis 对话框。在对话框左侧的变量列表中选变量X1 至X7,点击钮使之进入Variables 框。
主成分分析法 来自淘豆网m.daumloan.com转载请标明出处.