下载此文档

k-means聚类算法的研究.doc

文档分类：IT计算机 | 页数：约26页举报非法文档有奖

1/26

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/26 下载此文档

文档列表 文档介绍

k-means聚类算法的研究
k-means聚类算法的研究
1．k-means算法简介
k-means算法描述
给定n个对象的数据集D和要生成的簇数目k，划分算法将对象组织划分为k个簇（k<=.6 -
- -

-
-

-
- -
- -
- -
- - ];
[n,d] = size(x);
bn=round(n/k*rand);%第一个随机数在前1/K的范围内
nc=[x(bn,:);x(2*bn,:);x(3*bn,:)];%初始聚类中心
[cid,nr,centers] = kmeans(x,k,nc)%调用kmeans函数
for i=1:length(x),
if cid(i)==1,
plot(x(i,1),x(i,2),'r*') % 显示第一类
hold on
else
if cid(i)==2,
plot(x(i,1),x(i,2),'b*') %显示第二类
hold on
else
if cid(i)==3,
plot(x(i,1),x(i,2),'g*') %显示第三类
hold on
end
end
end
end
strt=['红色*为第一类；蓝色*为第二类；绿色*为第三类' ];
text(-4,-,strt);
（2）kmeans函数如下:
%
function [cid,nr,centers] = kmeans(x,k,nc)
[n,d] = size(x);
% 设置cid为分类结果显示矩阵
cid = zeros(1,n);
% Make this different to get the loop started.
oldcid = ones(1,n);
% The number in each cluster.
nr = zeros(1,k);
% Set up maximum number of iterations.
maxgn= 100;
iter = 1;
while iter < maxgn
%计算每个数据到聚类中心的距离
for i = 1:n
dist = sum((repmat(x(i,:),k,1)-nc).^2,2);
[m,ind] = min(dist); % 将当前聚类结果存入cid中
cid(i) = ind;
end
for i = 1:k
%找到每一类的所有数据，计算他们的平均值，作为下次计算的聚类中心
ind = find(cid==i);
nc(i,:) = mean(x(ind,:));
% 统计每一类的数据个数
nr(i) = length(ind);
end
iter = iter + 1;
end
% Now check each observation to see if the error can be minimized some more.
% Loop through all points.
maxiter = 2;
iter = 1;
move = 1;
while iter < maxiter & move ~= 0
move = 0;
% 对所有的数据进行再次判断，寻求最佳聚类结果
for i = 1:

k-means聚类算法的研究来自淘豆网m.daumloan.com转载请标明出处.