下载此文档

主成分分析.doc


文档分类:高等教育 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
主成分分析在牡丹江水质评价及浮游植物生物量与环境因子关系中的应用
魏景海
(浙江大学,杭州,150040)
摘要:利用统计软件R编写主成分分析程序,分析不同季节牡丹江浮游植物生物量与环境因子的关系,结果表明,春季影响牡丹江浮游植物生物量的主要环境因子为SD、CODMn、;夏季的主要影响因子为DO、CODMn和pH;秋季的主要影响因子为温度、DO、;冬季的主要影响因子为CODMn、DO、温度和BOB5。与于洪贤等的研究进行对比显示,两种方法的结论存在些许差异,尤其夏季主要影响因子差异较大,这与数据量小有一定关系。对不同采样点的水质污染程度分析表明,位于牡丹江中下游的5#、6#、7#采样点污染较重,这些采样点浮游植物生物量较少,因此浮游植物的数量为检验水质好坏的提供了新的参考。
关键词:统计软件R;主成分分析;浮游植物生物量;环境因子;水质
多元统计分析是统计学中一个非常重要的分支,在国外,从20世纪30年代起,已开始在自然科学、管理科学和社会、经济等领域广泛应用。而主成分分析又是多元统计分析的一个分支,是常见的一种常规综合评价方法。在用统计方法研究多变量问题时,人们就希望在定量研究中涉及的变量较少,而得到的信息量又较多。主成分分析正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信息的一种多元统计方法[1]。而统计软件R是主成分分析的有力工具,对数据的统计分析是通过程序命令完成的,快捷方便。目前,主成分分析主要被应用在医疗质量评价、水质富营氧化评价、地震预测、农作物需水预测等方面。如运用主成分分析法对太湖水质的富营养化情况进行的评价[2],对伊犁河8个监测断面的水质情况的研究[3],对牡丹江水质情况的研究还很少见到,只有于洪贤,曲翠等运用灰色关联分析方法对浮游植物丰度与环境因子关系进行了相关性分析[4]。本研究是通过R语言编写主成分分析程序代码,分析牡丹江浮游植物生物量与环境因子的关系,解读统计分析结果,与于洪贤等的研究结果进行对比,并评价牡丹江水质的污染程度。
1. 主成分分析理论概述
主成分分析(ponents analysis)也称主分量分析,是由霍特林(Hotelling)于1933年首先提出的。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。
设对某一事物的研究涉及p个指标,分别用表示,这p个指标构成的p维随即向量为。设随机向量X的均值为,协方差矩阵为。
对X进行线性变换,可以形成新的综合变量,用Y表示,也就是说,新的综合变量可以由原来的变量表示,既满足下式:
我们将线性变换约束在下面的原则之下:
(1),即。
(2)与相互无关。
(3)是的一切满足原则(1)的线性组合中方差最大者;是与不相关的的所有线性组合中方差最大者;类似的, 是与都不相关的的所有线性组合中方差最大者。
基于以上三条原则决定的综合变量分别称为原始变量的第一,第二,...,第p个主成分。其中各综合变量在总方差中占的比重依次递减,在实际工作中,通常只挑选前几个方差最大的主成分,从而达到简化系统结构,抓住问题实质的目的。
R语言下的主成分分析过程
数据来源于2006年4月至2007年1月,于洪贤等对牡丹江浮游植物生物量及其环境因子的检

主成分分析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数6
  • 收藏数0 收藏
  • 顶次数0
  • 上传人jiaoyuan2014
  • 文件大小116 KB
  • 时间2018-03-01
最近更新