聚类解析总结实验报告.doc《应用多元统计剖析》
课 程 实 验 报 告
实验名称:用聚类剖析的方法研究山东省 17个市的产业种类
的差别化
在聚剖析前,首先把数据行准化
xij
xijxji1,2,,n,j
1,2,
,n,
Rj
后的数据,每个量本均
0,准差
1,而且准化后的数据
xij
与量
的量 无关。采用系 聚 的方法,用最 距离法 算欧氏距离
m
2
dij
xit
xjt
i,j
1,2,
,n,其中xit
表示第i
个品的第t
个指的,xjt
i
1
表示第j
个品的第t个指的,
dij第i
个品与第j个品之的欧式距离。
若dij越小,那么第i
与j两个品之的性就越凑近。
最距离法求与之的距离,
Gp和Gq归并Gr后,按照最距离算新
Gr与Gk
其他的距离,其推公式
Drk
max
dij
Gr
Gp,Gq
=max
max
dij
,
max
dij
=max
Dpk,Dqkk
p,q
iGr,jGk
iGp,jGk
iGq,jGk
方法二:用离差平方和法(
WARD)品行分
离差平方和法是
Ward(1936)提出的,也称
Ward法。它鉴于方差剖析思想,如果
分得正确,同品之的离差平方和当小,
不同品之的离差平方和当大。
假设已将n个品分k,G1,G2,⋯,
Gk,nt表示Gt的品个数,
X(t)表
示
(t)
表示
Gt
中第i
个品(i=1,
⋯,
nt),Gt中品的离差平方和
Gt的重心,X(i)
nt
(t)
(t)
(t)
(t)
X
,
Wt=X(i)
X(i)X
i1
其中
X
(t)
,
X
(t)
向量,
Wt
一数(
t=1,2,
⋯
,k
)。
(i)
m
k个的离差平方和
k
k
nt
(t)
(t)
(t)
(t)
W=Wt=
X
.
X(i)X
X(i)
t=1
t=1
i1
当k固准时,要选择使 W达到极小的分类。
Ward法的基本思想是,先将 n个样品各自成一类,此时 W=0;然后每次将其中某两类
归并为一类,因每缩小一类离差平方和就要增加, 每次选择使W增加最小的两类进行归并,
直至所有样品归并为一类为止。
Ward法把某两类归并后增加的离差平方和当作为类间的平方距离,即令
Dpq2=Wr
Wp
Wq
表示类
Gp和Gq的平方距离,其中
Gr
Gp,Gq
,Wr,Wp,Wq分别为
Gr
,Gp
,Gq类
中样品的离差平方和。利用 Wr的定义,可得
nr
X((r)t)
X(r)
X(
聚类解析总结实验报告 来自淘豆网m.daumloan.com转载请标明出处.