下载此文档

聚类分析与单因素方差分析简介.ppt


文档分类:高等教育 | 页数:约53页 举报非法文档有奖
1/53
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/53 下载此文档
文档列表 文档介绍
聚类分析与单因素方差分析简介
The user can demonstrate on a projector or computer print the presentation and make it into e used in a 聚类法(实际应用中使用最多)。
系统聚类法的基本思想
令n个样品自成一类,计算出相似性测度;
此时类间距离与样品间距离是等价的,把测度最小的两个类合并;
然后按照某种聚类方法计算类间的距离,再按最小距离准则并类;
这样每次减少一类,持续下去直到所有样品都归为一类为止。
聚类过程可做成聚类谱系图(Hierarchical diagram)。
常见类间距离的计算方法
Between-groups linkage 组间平均距离连接法
用D(p,q)表示类p和类q之间的距离
方法简述:将两个类所有的样本对(样本对的两个成员分属于不同的类)的平均距离作为两类的距离,合并距离最近或相关系数最大的两类。此方法利用了两个类中所有的样本信息。
Between-groups linkage 组间平均距离连接法
特点:非最大距离,也非最小距离
思考:除了用平均值作为特征值外,还可采用什么特征值?
Nearest neighbor 最近邻法(最短距离法)
方法简述:用两类中所有样本对的距离的最小值作为两类的距离,合并最近或最相似的两项。
特点:样品有链接聚合的趋势,这是其缺点,不适合一般数据的分类处理,除去特殊数据外,不提倡用这种方法。
Furthest neighbor 最远邻法(最长距离法)
方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法。
Median clustering 中位数法
方法简述:以用两类中所有样本对的距离中位数作为两类间的距离。
特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。
Centroid clustering 重心聚类法
方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值。
特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦。
Within-groups linkage 组内平均连接法
方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小,包括两个类之间的样本对以及两个类内的样本对。
Ward’s method 离差平方和法
方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大。
特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。
续例1、对1982年6个地区农民家庭收支情况,进行聚类分析。
地区
食品
衣着
燃料
住房
生活用品
文化生活
北京
196
44




上海
221
39
13



广东
183
21
18
42
37
12
四川
138
21
11
18
16

贵州
122
22
13
14
12

云南
124
20

14
16
3
这里6个变量都以元为单位,量纲相同且数量级相差不大,可以不用做标准化处理。
方法:
样本间距离——采用平方欧氏距离;
类间距离 ——采用组间平均距离连接法
此时,距离越小越相似!5、6最相似
类间距离——采用组间平均距离连接法






类间距离——采用组间平均距离连接法
图表阅读说明: 以stage 2为例
地区5在stage 1中出现过;
stage 2这里的类,下一次将在第5步再次参与聚类,衔接地区是地区4
类似进行下去,可得聚类谱系图(树状图)
3、聚类过程与方法
构造关系矩阵
数据预处理
确定最佳分类
标准化
亲疏关系的描述
聚类
根据不同方法进行分类
类别数
1
2
3
4
(4)谱系分类的确定
经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:
任何类都必须在临近各类中是突出的,即各类重心间距离必须极大
确定的类中,各类所包含的元素都不要过分地多
分类的数目必须符合实用目的
若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类
28个地区聚类图

聚类分析与单因素方差分析简介 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数53
  • 收藏数0 收藏
  • 顶次数0
  • 上传人核辐射
  • 文件大小1.32 MB
  • 时间2022-07-11
最近更新