.
地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是 经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性, 而且在许多实 际问题中,多个变量之间是具有一定的相关关系的。 因此,我们就会很自然地想 到,能否在各个变量之间相关关系研究的基础上, 用较少的新变量代替原来较多 的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信 息?事实上,这种想法是可以实现的,这里介绍的主成分分析方法就是综合处理 这种问题的一种强有力的方法。
一、主成分分析的基本原理
主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法, 从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有 p个变量描述,这样就构成了一个 nxp阶的地理数据矩阵:
di
XI2
川Xip
X = *
X2i
III
X22
III
川X2p
HI III
(i)
Xu
Xn2
川Xnp
如何从这么多变量的数据中抓住地理事物的内在规律性呢?要解决这一问 题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需 要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标, 而且使
这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息, 同时它们之
间又是彼此独立的。那么,这些综合指标(即新变量 )应如何选取呢?显然,其 最简单的形式就是取原来变量指标的线性组合, 适当调整组合系数,使新的变量 指标之间相互独立且代表性最好。
如果记原来的变量指标为Xi,X2,…,Xp,它们的综合指标
主成分分析法 来自淘豆网m.daumloan.com转载请标明出处.