影响贵州省城镇居民生活水平的因素分析
周 莉
(贵州民族学院理学院)
摘 要:本文收集了1992年到2008年贵州省城镇居民生活水平的数据,从贵州省城镇
开展本文的研究,对于贵州省城镇居民生活水平的因素研究要从多方面进行,要全面考虑。所以本文重点研究影响贵州城镇居民生活水平的因素,就是想从中找出两个甚至更多因素来,解释产生这种现象的原因。本文采用主成分分析方法对评价指标体系进行定量分析,找出影响贵州省城镇居民生活水平的主要因素,用逐步回归法构建回归模型,求“最优”回归方程,根据最优回归方程,找出在回归分析中影响城镇居民生活水平的主要的因素,在综合两种方法得出的结果,最后得出影响城镇居民生活水平因素的正确结论,并对贵州省城镇居民生活水平情况作评价分析,最后给出提高贵州省城镇居民生活水平的一些有帮助性的建议。
2. 主成分分析与多元回归分析方法介绍
主成分分析的原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理“降维”的一种方法。
主成分分析的基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指针),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指针作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指针的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
设有p个指针(变量),这p个指针(变量)反映了客观对象的各个特性,因此,每个对象观察到的p个指针(变量)值,就是一个观察值,它是一个p维的向量。如果观察了n个对象,就有n个p维向量,共有np个资料,用矩阵表示就有:
其中,n为观察对象数,p为指针或变量数。矩阵中的每一行就是一个对象的观察值。对原始数据进行标准化处理,处理方法是:
,
式中:
,标准化处理后,
资料的方差为1,均值为0。
主成分的推导
设随机向量X的协方差阵为Σ,用矩阵X的p个向量作线性组合,则可得综合指标为:
上式可写为:
其中:
,
求主成分就是寻找X的线性函数,使相应的方差尽可能地大。即使:达到最大值,且。设协方差矩阵Σ的特征根为,相应的单位特征向量为,令:
其中:
根据线性代数的有关知识,可得:,且
则有:
而且,当时,有:
可见, 可使达到最大值,且
同理可得:
并且:
,式中。
上面的讨论表明,的主成分就是以的特征向量为系数的线性组合,它们互相不相关,其方差为的特征根。由于的特征根,,所以有:
,
将称为第一主成分的贡献率,一般地,将称为第m个主成分的贡献率。由于,因此,第m个主成分的贡献率实际上就是第m个主成分的方差在全部方差中所占的比重。这个值越大,表明第m个主成分综合的能力越强。
我们将前两个主成分的累计贡献率定义为,前m个主成分的累计贡献率定义为:。
一般地如果前m个主成分的累计贡献率达到了85%,则表明前m个主成分基本涵盖了全部观察变量或指针所包含的信息。
在实际应用中,我们并不是取全部的p个主成分,而是根据上述累计贡献率的大小,取累计贡献率达到了85%的主成分个数作为分析研究的基础。将各观察对象的观察值代入各主成分的表达式中,我们就可以得到各观察对象的各主成分的得分。
主成分分析用于系统评估
系统评估是指对系统的运营状态所进行的评价与推测。而在具体评估中,往往需要综
合考察多个运营指标,这就难于直接进行比较分析。所以评估问题的关键是如何科学地、客观地将一个多指标问题转化成一个单指标的问题。系统评估在社会、经济等许多领域有着广泛而又重要的应用,这里将主成分进行线性组合。
线性组合中各主成分的权数取为相应主成分的方差贡献率。这样可得如下的综合评价函数:
,
其中,y为综合评价指标,分别为第一主成分、第二主成分、. . .、第m主成分的方差贡献率。在实际应用中,为了
主成分分析 来自淘豆网m.daumloan.com转载请标明出处.