第八章. 主成分分析ponent Analysis
工作目的:高维数据表的降维
基本原理:平移变换旋转变换
计算方法
分析技巧:分析精度、主成分命名等
教材:第十一章
引言
一. PCA的主要功能
在信息损失最小的前提下,对高维空间进行降维处理。
数据类型: 样本点变量(定量变量)
在一个低维空间辩识系统,要比在高维空间容易得多。
例1. Scott [英] 1961年对157个英进行调查。
原始变量57个 5个新的综合变量
例2. Stone[美] 1947年关于国民经济的研究。利用美国1929~1939年各年数据,得到17个反映国民收入与支出的变量。
原变量17个 F1(总收入 I )
F2(总收入变化率I)
F3 (经济发展或衰退趋势 t)
主成分与实测变量的相关系数表
两个特殊的情况
1. 将一个高维变量系统有效的降至2维
高维不可见空间直观平面图示
(抽象思维) (形象思维)
** 增加决策知识,提高决策人员的洞察能力。
例: 管理期刊分类评估
一张354 维的数据表,
你能立刻看见这些期刊
有什么特点吗?
相关圆图:
2. 将一个高维变量系统有效的降至 1 维
有可能将高维指标系统综合指数
例2:Kendall [英] 评估英。48个郡,10种农作物:小麦(x1)、大麦(x2)、燕麦(x3)、土豆(x4)、菜豆(x5)、马铃薯(x6)、萝卜(x7)、饲料甜菜(x8)、临时牧场干草(x9)、永久牧场干草(x10)。
Y1= x1+ x2+ x3+ x4+ x5
+ x6+ x7+ x8+ x9+ x10
(精度:%)
ch8 主成分分析2016 来自淘豆网m.daumloan.com转载请标明出处.