下载此文档

基于决策树规则分类算法的研究(12-15).ppt


文档分类:IT计算机 | 页数:约37页 举报非法文档有奖
1/37
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/37 下载此文档
文档列表 文档介绍
基于决策树规则分类算法的研究
报告人:孙秀芳
2010年12月15日
介绍内容
研究的主要内容
数据挖掘及其分类方法概述

基于规则排序的决策树分类算法CABRR的研究
一、研究的主要内容
研究的主要内容:从决策树入手,从中提取决策树规则,并通过对决策树规则进行有效地排序后生成分类器,应用于分类预测。
二、数据挖掘及其分类方法概述
数据挖掘的理论
分类概念及算法描述
分类算法度量的方法与尺度
数据挖掘的理论
数据挖掘的概念:所谓数据挖掘(又称数据库中的知识发现)是指从大量的、不完全的、有噪声的、模糊的、随机的海量数据中,或是大型数据库或数据仓库中提取隐含的、未知的、非平凡的、有潜在应用价值的信息或模式。
数据挖掘的过程:确定挖掘目的、数据准备、数据挖掘、模式评估与知识表示。
数据挖掘的具体过程如下图所示:
数据源
清理/集成
后数据
选择/变换
后数据


提供可
供挖掘
的知识
清理与
集成
选择与
变换
数据
挖掘
评估与
表示
分类概念及算法描述
分类的概念:所谓分类,就是对己知现存的类别,建立类别的描述规则分类器,然后对未知新例的观察值进行判断归类。
下图为分类过程图:
训练集
分类模型
可接受的
模型
预测结果
通过分类算
法建立模型
评估
模型
预测
未知数据
元组
典型的分类算法:
常用的分类方法包括:决策树分类、关联分类、神经网络、贝叶斯分类方法等。
基于决策树分类的典型算法有:ID3算法、、PART算法、CABRR算法等。
分类算法度量的方法与尺度
每种分类方法都需要用一定的指标来进行评估,常用的分类算法的比较与评估标准有如下几个方面:

预测的准确率
可理解性
可伸缩性
速度
强壮性
三、
决策树算法的基本理论
决策树的基本算法

基于决策树规则分类算法的研究(12-15) 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数37
  • 收藏数0 收藏
  • 顶次数0
  • 上传人企业资源
  • 文件大小0 KB
  • 时间2012-01-24