精选优质文档-----倾情为你奉上
精选优质文档-----倾情为你奉上
专心---专注---专业
专心---专注---专业
精选优质文档-----倾情为你奉上
专心---专注---专业
南京信息工程大学 滨江学院 实验(实习)计算设定可允许的最小标准差。SimpleKMeans使用k均值来聚类数据;聚类的数量通过一个参数设定。Cobweb实现了用于名词属性的Cobweb算法和用于数值性属性的Classit算法。FarthestFirst实现Hochbaum和Shmoys远端优先遍历算法。MakeDensityBaseCluster是一个元聚类器,它包装一个聚类算法,使其返回一个概率分布和密度。它为每个聚类拟合一个离散分布,或一个对称的正态分布。
精选优质文档-----倾情为你奉上
精选优质文档-----倾情为你奉上
专心---专注---专业
专心---专注---专业
精选优质文档-----倾情为你奉上
专心---专注---专业
实验操作
(1)在开始程序(或者桌面图标),单击即可启动WEKA,启动WEKA时会发现首先出现的一个命令提示符。接着将出现如下Weka GUI Chooser界面。
(2)选择GUI Chooser中的探索者(Explorer)用户界面。点击预处理(Preprocess)功能按钮的,Open file,选择其中的“bank-data”数据作关联规则的分析。打开“bank-”,可以看到“Current relation”、“Attributes”“Selected attribute”三个区域。
(3)对于原始数据“bank-”的预处,删去属性“id”,保存为ARFF格式后,修改属性“children”为分类型。这样得到的数据文件为“”,含600条实例。
精选优质文档-----倾情为你奉上
精选优质文档-----倾情为你奉上
专心---专注---专业
专心---专注---专业
精选优质文档-----倾情为你奉上
专心---专注---专业
(4)用“Explorer”打开刚才得到的“”,并切换到“Cluster”选项卡。点击“Choose” 在随后打开的层级式菜单中的选择“SimpleKMeans”,这是WEKA中实现K均值的算法。点击旁边的文本框,修改“numClusters”为6,说明我们希望把这600条实例聚成6类,即K=6。下面的“seed”参数是要设置一个随机种子,依此产生一个随机数,用来得到K均值算法中第一次给出的K个簇中心的位置,先设定为10。
(7)选中“Cluster Mode”的“Use training set”,点击“Start”按钮,观察右边“Clusterer output”给出的聚类结果。也可以在左下角“Result list”中这次产生的结果上点右键,“View in separate window”在新窗口中浏览结果。
(8)实验结果:
结果中有这么一行字样:
Within cluster sum of squared errors:
精选优质文档-----倾情为你奉上
精选优质文档-----倾情
基于划分方法的聚类分析(共4页) 来自淘豆网m.daumloan.com转载请标明出处.