下载此文档

数据挖掘课程报告论文.doc


文档分类:IT计算机 | 页数:约57页 举报非法文档有奖
1/57
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/57 下载此文档
文档列表 文档介绍
武汉工程大学
计算机科学与工程学院
课程报告论文
课程名称: 数据仓库与数据挖掘
论文题目: ID3算法分析与改进
学生学号: 0905060205
专业班级: 09信技02班
学生姓名: 邓曌
学生成绩:
指导教师(职称): 刘军(副教授)
课题工作时间: 2012-03-10 至 2012-04-20
说明:
试题
数据仓库与数据挖掘课程要求从以下几个方向选择一个方向对数据仓库与数据挖掘的发展和现况出发,并给出个人对该技术的综述性描述:
;
;
;
-Means算法。
论文字数要求3000-3500字左右,论文格式和武汉工程大学计算机学院要求一致,本论文题目必需打印并与论文一起装订。
评分标准
对所选课题的研究现状(必需附录参考文献,且参考文献必须为期刊,并注意文献格式)进行描述正确。40分
对所选课题中某新技术的发展与展望进行描述正确。30分
对所选课题中某一主题发展的个人评价。20分
论文格式正确、符合学院要求。10分
要求全文不得从网络中抄袭,除被引用的部分内容,自选内容(例如3部分)必须联系自己的实际。
目录
摘要 iv
Abstract v
第一章绪论 1
数据挖掘技术 1
决策树分类算法及其研究现状 8
10
11
第二章决策树分类算法相关知识 12
12
ID3分类算法基本原理 18
20
24
25
29
第三章 ID3算法的具体分析 30
ID3算法分析 30
34
本章小结 39
第四章实验结果分析 40
实验结果分析 40
本章小结 41
第五章总结与展望 42
参考文献 44
致谢 45
附录 46
摘要
信息高速发展的今天,面对海量数据的出现,如何有效利用海量的原始数据分析现状和预测未来,已经成为人类面临的一大挑战。由此,数据挖掘技术
应运而生并得到迅猛发展。
数据挖掘是信息技术自然演化的结果,是指从大量数据中抽取挖掘出来隐含未知的、有价值的模式或规律等知识的复杂过程。
本文主要介绍如何利用决策树方法对数据进行分类挖掘。文中详细的阐述了决策树的基本知识和相关算法,并对几种典型的决策树算法进行了分析比较,如:核心经典算法——ID3算法;能够处理不完整的数据、;利用GINI系数判别数据集中的分裂属性并形成二叉树的CART算法;使数据的分类不受机器主存的限制,有着良好的伸缩和并行性的SLIQ和SPRNIT算法。ID3算法是最核心的技术,所以本文主要对它进行了研究和设计实现。
第四章在JAVA编译器上实现ID3算法,并对结果进行分析,决策树生成,分类规则的提取,以便于以后直接使用这一规则进行数据分析。在论文的最后一章介绍了目前数据挖掘技术的研究前景。
关键词:数据挖掘;决策树;ID3算法;信息增益;熵值
Abstract
Today, the massage is passed very quickly. How to investigate current status and forecast the future with good use of tremendous original Data has been ing the big challenge to human beings when facing the emergence of mass Data in information era. Consequently, Data mining technology emerge and boom quickly.
Data mining, is the product of the evolution of information technology, which is plex process excacting the implicated and valuable pattens, knowledge and rules from a large scale of dataset.
This paper mainly introduces the decision tree algorithm for classificati

数据挖掘课程报告论文 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数57
  • 收藏数0 收藏
  • 顶次数0
  • 上传人buhouhui915
  • 文件大小708 KB
  • 时间2017-11-24