提供各专业全套设计
目录
摘要 iii
Abstract iv
第一章绪论 1
数据挖掘技术 1
数据挖掘技术的应用背景 1
2
数据挖掘的方法 4
数据挖掘系统的发展 5
数据挖掘的应用与面临的挑战 6
决策树分类算法及其研究现状 8
10
11
第二章决策树分类算法相关知识 12
12
12
13
15
16
18
ID3分类算法基本原理 18
20
24
25
29
第三章 ID3算法的具体分析 30
ID3算法分析 30
ID3算法流程 30
ID3算法评价 33
34
决策树的生成 34
分类规则的提取 37
38
本章小结 39
第四章实验结果分析 40
实验结果分析 40
40
分类规则的提取 40
本章小结 41
第五章总结与展望 42
参考文献 44
致谢 45
附录 46
摘要:信息高速发展的今天,面对海量数据的出现,如何有效利用海量的原始数据分析现状和预测未来,已经成为人类面临的一大挑战。由此,数据挖掘技术
应运而生并得到迅猛发展。
数据挖掘是信息技术自然演化的结果,是指从大量数据中抽取挖掘出来隐含未知的、有价值的模式或规律等知识的复杂过程。
本文主要介绍如何利用决策树方法对数据进行分类挖掘。文中详细的阐述了决策树的基本知识和相关算法,并对几种典型的决策树算法进行了分析比较,如:核心经典算法——ID3算法;能够处理不完整的数据、;利用GINI系数判别数据集中的分裂属性并形成二叉树的CART算法;使数据的分类不受机器主存的限制,有着良好的伸缩和并行性的SLIQ和SPRNIT算法。ID3算法是最核心的技术,所以本文主要对它进行了研究和设计实现。
第四章在JAVA编译器上实现ID3算法,并对结果进行分析,决策树生成,分类规则的提取,以便于以后直接使用这一规则进行数据分析。在论文的最后一章介绍了目前数据挖掘技术的研究前景。
关键词:数据挖掘;决策树;ID3算法;信息增益;熵值
Abstract: Today, the massage is passed very quickly. How to investigate current status and forecast the future with good use of tremendous original Data has been ing the big challenge to human beings when facing the emergence of mass Data in information era. Consequently, Data mining technology emerge and boom quickly.
Data mining, is the product of the evolution of information technology, which is plex process excacting the implicated and valuable pattens, knowledge and rules from a large scale of dataset.
This paper mainly introduces the decision tree algorithm for classification. Firstly, the basic knowledge about decision tree and some representative algorithms for inducing decision tree are discussed, including ID3,which is classical;,which can deal with continuous attributes and some
毕业设计(论文)-数据挖掘技术 来自淘豆网m.daumloan.com转载请标明出处.