下载此文档

连续数据的离散化研究[文献综述].doc


文档分类:论文 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
( 2011 届)
毕业论文(设计)
文献综述
题目: 连续数据的离散化研究
学院: 数学与信息工程学院
专业: 信息管理与信息系统
班级:
学号:
姓名:
指导教师:
教务处制
一、前言部分
如今,随着计算机、网络和通讯等信息技术的高速发展,当今社会已经进入了网络信息时代,计算机技术得到了迅猛的发展,特别是存储技术、数据库技术和网络技术,信息处理在整个社会规模上迅速产业化,在技术表现为整个社会对大规模数据操作的产业化。存储设备单位价格的不断下跌而容量的急剧扩大,关系数据库、对象数据库、多媒体数据库、地理信息数据库和空间数据库的不断成熟并得到广泛的应用,数据库管理系统的口益普及,这使得人们所积累的数据越来越多,并且数据与信息系统中的不确定性更加显著。海量的数据背后隐藏着许多重要的信息,人们希望能够对其进行深入分析,以便更好地利用这些数据所隐藏的信息。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势[1],缺乏挖掘数据背后隐藏知识的手段,导致了“数据爆炸但知识贫乏的现象”[2]。例如,商业上条形码的普遍使用,使得每天很多行业都积累了数以万计的数据,各种同步卫星每小时传回地球的遥感图像数据就达50千兆字节。要把大量的数据作为信息,信息成为知识,知识付诸于应用,已使一些传统的方法感到无能为力。因此,如何从大量的、杂乱无章的、强干扰的数据中挖掘出潜在的、有利用价值的信息,便成为人类智能信息处理中面临的前所未有的挑战。由此产生了人工智能研究的一个崭新领域一一数据挖掘(Data Mining,简称DM)[3]。
数据离散化技术在传统的机器学习中被当作边缘性课题而没有受到足够的重视,随着近年来数据挖掘的不断更新发展,数据离散化在数据挖掘技术中渐渐显现出其不可替代的重要性,在规则提取、特征分类等很多算法中,尤其是在应用粗集理论进行数据挖掘的研究中,连续属性数据必须进行离散化,因此越来越多的专家和学者开始关注数据离散化[4]。
在粗糙集理论的研究中,连续属性的离散化虽然不是什么研究热点,然而它是数据预处理中的一个重要部分[6],对于粗糙集这种主要是以离散型变量作为属性类型的学习方法,连续性变量必须被离散化才能够被学习,国内外许多学者都对此方面予以了关注,另一方面,由于粗糙集与数据挖掘技术的紧密联系关系,所以连续数据的离散化是当前数据挖掘研究中一个重要方向。
目前,国内学界虽然对粗糙集理论有一定的认识,但是对于它在数据挖掘中的应用还重视不够,对不同类型的决策表的属性约简、值约简还未提出高效率的、可行的算法[3]。即使有,也不能够很好地进行处理,存在一定的缺点。这大大地阻碍了粗糙集理论在实际中的应用
[7]。所以,个人认为对连续数据的离散化研究是当今国内一个重要的课题。
二、主题部分

随着信息技术的发展,信息技术已经成为当今社会最为活跃的领域。被喻为信息时代的20世纪90年代以来,数据库管理系统的日益普及,使人们能够非常方便地获取和存储大量的数据。而对数据仅仅做表层的处理,已经不能够满足社会的需要,因而深入挖掘,对数据内在的关系和隐含的信息成为了当前众多科学研究的热点,也就是只能信息处理成为了众多科学领域研究的热点。特别是近年

连续数据的离散化研究[文献综述] 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人问道九霄
  • 文件大小0 KB
  • 时间2012-04-12