第四章主成分分析
主成分概述
主成分的数学原理
主成分分析在综合评价中的应用
主成分回归分析
推荐阅读
引言
区域经济分析中,常常需要用多个指标对多个区域或城市进行综合评价。其共同特点是将多个相关指标合成一个综合指标,反映各地区的综合水平。
其步骤体现:;
。
方法有层次分析法AHP,专家意见法,主成分分析或因子分析法等。
主成分概述
主成分概念首先由 Karl Parson在1901年引进,当时只对非随机变量来讨论的。1933年Hotelling将这个概念推广到随机变量。
在多数实际问题中,不同指标之间是有一定相关性。由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性。
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。
主成分的基本原理
主成分分析是考察多个数值变量间相关性的一种多元统计方法,它是研究如何通过少数几个主成分来解释多变量的方差—协方差结构。
导出几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间不相关。
主成分分析的基本思想
将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。
以两个指标为例,信息总量以总方差表示:
其中y1、y2分别都是x1、x2的线性组合,并且信息尽可能地集中在y1上。在以后的分析中舍去y2,只用主成分y1来分析问题,起到了降维的作用。
主成分分析就是通过适当的变量替换,使新变量成为原变量的线性组合,并寻求主成分来分析事物的一种方法。
几何解释
旋转变换的目的是为了使得n个样本点在y1轴方向上的离散程度最大,即y1的方差最大,变量y1代表了原始数据的绝大部分信息,在研究某经济问题时,即使不考虑变量y2也损失不多的信息。
Y1与y2除起了浓缩作用外,还具有不相关性。
Y1称为第一主成分,y2称为第二主成分。
主成分分析的数学原理
对原有变量作线性变换,
要求:
主成分的数学性质
如果z1=u1’x满足①②
则称z1为x的第一主成分。
若z1不足以代表原变量所包含的信息,就考虑采用z2。
Z2满足①②
③
Z2为第二主成分
主成分的数学性质
从公式的计算推导可以发现,主成分方程中的系数向量U恰好是原有变量协方差矩阵的特征向量,其特征根是主成分的方差。
ch04第四章 主成分分析 来自淘豆网m.daumloan.com转载请标明出处.