下载此文档

统计分析-主成分分析.ppt


文档分类:高等教育 | 页数:约26页 举报非法文档有奖
1/26
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/26 下载此文档
文档列表 文档介绍
地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间具有一定的相关关系。
解决该问题的一个办法就是筛选变量,即只挑选部分较为重要的变量,以减少变量数,并可缓解相关性带来的麻烦-如逐步回归分析、逐步判别分析等。
换一个角度来看,如果众多的变量间存在着的相关关系,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?
主成分分析和因子分析就是综合处理这种问题的一种强有力的工具。
§8 主成分分析
问题的提出
1
编辑ppt
问题的提出
主成分分析方法(principal component analysis,PCA )就是综合处理这种问题的一种强有力的工具。它把原来多个变量(显式变量)转化为少数几个综合变量(潜式变量)。综合变量即主成分(principal compontent)综合变量之间相互独立,且能反映原来多个变量的大部分信息。
主成分分析采用的主要原则是使方差最大,以期尽可能多的保留原有变量所包含的信息,同时又能用尽可能少的主成分替代原有变量,从而使问题变的简便。
但是,这些主成分通常并没有明确的专业意义。因子分析是主成分分析的一种推广。它从一定的模型出发,找出几个反映原有变量的公共因子,并力求使之有较为合理的专业解释。
§8 主成分分析
2
编辑ppt
§8 主成分分析
问题的提出
[引例8-1] 2000年全国各地
区经济效益主要指标有以下
8个:GDP(亿元)、工业
增加值(%)、总资产贡
献率(%)、资产负债率
(%)、流动资产周转次
数(次/年)、工业成本费
用利润率(%)、全员劳动
生产率(元/)、产品
销售率(%)。
3
编辑ppt
§8 主成分分析
4
编辑ppt
§8 主成分分析
问题的提出
5
编辑ppt
§8 主成分分析
问题的提出
6
编辑ppt
§8 主成分分析
什么是主成分分析
主成分分析的数学模型
主成分分析的主要步骤
如何在SPSS软件中进行主成分分析
7
编辑ppt
§8 主成分分析
什么是主成分分析
主成分概念首先由Kal parson在1901年提出,不过当时
只对非随机变量来讨论的。1933年Hotelling将这个概念推
广到随机向量。
主成分分析(Principal Components Analysis ,PCA)也
称为主分量分析,是一种通过降维来简化数据结构的方
法,即如何把多个变量(变量)转化为少数几个综合变量
(综合变量),而这几个综合变量可以反映原来多个变量
的大部分信息。
为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。
8
编辑ppt
§8 主成分分析
什么是主成分分析
在实际问题中,经常遇到多变量(指标)问题,而且变量之间有一定的相关性。变量多且变量间有一定的相关性,势必增加了分析问题的复杂性。
主成分分析就是设法将原来变量重新组合成一组新的互相无关的几个综合变量来代替原来变量,同时根据实际需要从中可取几个较少的综合变量尽可能多地反映原来变量的信息。
9
编辑ppt
§8 主成分分析
基本思想
主成分分析就是设法将原来众多具有一定相关性的变量(如p个变量),重新组合成一组新的相互无关的综合变量来代替原来变量。怎么处理?
通常数学上的处理就是将原来p个变量作线性组合作为新的综合变量。如何选择?
如果将选取的第一个线性组合即第一个综合变量记为F1,自然希望F1尽可能多的反映原来变量的信息。怎样反映?
最经典的方法就是用方差来表达,即var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称之为第一主成分(principal component I)。
10
编辑ppt

统计分析-主成分分析 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数26
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小562 KB
  • 时间2020-12-25