下载此文档

大数据挖掘 xxx xxxx.doc


文档分类:办公文档 | 页数:约38页 举报非法文档有奖
1/38
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/38 下载此文档
文档列表 文档介绍
大数据挖掘_xxx_xxxxword
word
1 / 38
word
中南民族大学
计算机科学学院
《数据挖掘与知识发现》
综合实验报告
姓 名
年 级级
专 业 软件工程
指导教师李波
学 号
序 号 31
实验类型综合型
成绩评定
评语:
教师签名:
年 月 日
2016 年 12月 15日
word
word
2 / 38
word
年级
 
专 业
软件工程
班级
组号
实验室
9-205
日期
实验
名称
  数据挖掘与知识发现




分项内容
实验级别
Weka环境熟悉;决策树〔1〕
决策树〔2〕
关联规如此,聚类分析
KDD案例
属性相关性,神经网络〔1〕
神经网络〔2〕
小 组 成 员
某某
学号
组内分工
自我评分
教师评分
 
 
 
 
 
word
word
3 / 38
word
实验分项1
  Weka环境熟悉;决策树〔1〕




熟悉Weka软件的环境和根本用法。
掌握ARFF数据文件的编制方法。
学习应用Weka软件建立决策树的方法,并理解决策树的剪枝和未剪枝的分类效果。




1、 参照教材 19 -22 页内容,熟悉 页内容,熟悉 WekaWeka Weka软件的安装与使用环境;
2、在记事本程序中编制 ColdType , .
3、打开 WekaWeka Weka软件,并参 软件,并参 照教材 ,完成相关操作并 小节,完成相关操作并 小节,完成相关操作并 小节,完成相关操作并 理解 相应 处理结果。
4、根据教材表 所提供的数据集 T,基于 WekaWeka Weka软件,应用 算法建立决策树, 预测某个学生是否决定去打篮球。
要求:〔 1〕采用 arff arff文件来完成; 文件来完成;〔2〕分别完成决策树剪枝和未的情况。












1.熟悉Weka软件的环境和根本用法并编写arff文件。
我们实验中Weka访问的数据格式是arff格式的。
运行Weka后,出现了窗口,我们在里面选择Explorer界面。
在Preprocess选项卡,点击file按钮,加载arff文件,就可以对文件中的数据进展采集挖掘。
用data定义数据集的开始,数据值用逗号隔开,假如存在缺失数据,如此用问号表示。
2.打开Weka软件,按照教材要求完成相关操作,并理解相应处理结果
 (1)在打开arff文件后,界面详细显示了数据集的实例个数,属性值的比例关系等。
word
word
4 / 38
word
图1
word
word
5 / 38
word












 (2)在界面中可以进展属性和实例的筛选,直接在对话框中对数据实例进展筛选,对缺失数据进展填补,重命名甚至进展排序也可以。
 
 (3)建立分类模型,切换到classify选项卡,单击choose按钮,打开分类器选择对话框,选择J48来建立决策树模型。在Testoptions面板底部有一个Moreoptions按钮,单击该按钮,打开Classifier evaluationoptions对话框,设置选中Outputpredictions复选框,可以在输出结果中出现预测输出结果。单击start按钮,就可以执行数据挖掘。
 
图2
 (3)在Resultlist列表框的会话条目上右击,从快捷菜单中选择Visualize tree命令,打开Tree View窗口,可以看到感冒类型诊断决策树。
word
word
6 / 38
word












 
图3
 (4)利用所建立的分类模型分类未知实例,在执行数据挖掘前,将Testoptions检验方式设置为Supplies test set,并打

大数据挖掘 xxx xxxx 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数38
  • 收藏数0 收藏
  • 顶次数0
  • 上传人511709291
  • 文件大小2.14 MB
  • 时间2021-12-17