基于粗糙集的数据及文本挖掘方法的研究(可复制毕业论文).pdf


文档分类:IT计算机 | 页数:约102页 举报非法文档有奖
1/102
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/102
文档列表 文档介绍
中文摘要关键词:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域:将软计算方实用价值。本文研究了基于粗糙集的数据挖掘和文本挖掘方法,主要包括数据重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学了一种将特征选取和粗集方法相结合的文本分类规则抽取方法。该方法大大提对相关文献中隶属函数的定义进行了改进,并且利用隶属函数的性质提出将模式聚合理论和潜在语义索弓砺巯嘟岷希岢隽艘恢治谋窘滴路提出了一种改进的基于粗集和搜索的属性约简算法。改进后的算法最终聚类结果时,引进了知识简洁度作为凝聚的终止条件。定聚类的数目,又具有较好的算法复杂度。粗糙集数据挖掘文本挖掘属性约简聚类分类法之一的粗糙集理论应用于数据及文本挖掘方法研究,具有较大的理论意义和挖掘和文本挖掘中的属性约简问题、聚类问题;文本挖掘中的分类规则抽取问题;以及粗糙集同模糊集相结合的数据挖掘方法。所做主要工作内容包括:将粗集和遗传算法相结合成功应用于文本模糊聚类。在聚类过程中,将权性和可操作性。给出了近似规则的定义,并对值的意义进行了讨论。在此基础上提出高了文本规则抽取的效率,并使其更趋实用化。了一种从定量决策表转换为定性决策表的转换规则,利用此转换规则可以将原来的定量决策表转换为一个同样大小的定性决策表,这样大大减少了后面利用粗集理论进行规则抽取的计算量,而且提取的规则质量也有了很大提高。法。它首先用理论对文本特征进行初步降维,在此基础上利用椒ǘ文本特征进一步降维,抽取隐藏在文本中的主要语义信息。既具有较高的算法效率,又能以较大的概率得到最小属性约简。提出了基于知识简洁度的粗集聚类方法,它首先计算对象集合在每个属性下的划分;然后在对初始划分进行合并时,引进了不可分辨度的概念;在形成将基于次胜对手惩罚的竞争学习算法应用于文本聚类,这种方法既能自动确天津大学博士论文摘要
:,甒甅琧瑃瑆.’╩.,天津大学博士论文.,:琣甌甀甋経..琧摘要
砍秒鳓夯貌埘学位论文作者签名:易巧移参如阩,月,占日独创性声明学位论文版权使用授权书或撰写过的研究成果,也不包含为获得墨洼盘鲎或其他教育机构的学位或证本学位论文作者完全了解墨鲞盘茎有关保留、使用学位论文的规定。特授权鑫注盘鲎可以将学位论文的全部或部分内容编入有关数据库进行检仍索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校签字日期:∞巧年拢向国家有关部门或机构送交论文的复印件和磁盘。本人声明所里交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签字日期:C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得学位论文作者签名导师签名目
第一章绪论选题的研究背景和意义据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据文本挖掘是数据挖掘的一个分支,是以文本型信息源作为挖掘对象,利用定量计算和定性分析的办法,从中寻找信息的结构、模型、模式等隐含的具有潜在由于数据集体现出越来越多的无标签性、不确定性、不完整性、非均匀性和随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。面对这一挑战,数据挖掘和知识发现技术应运而生,并显示出强大的生命力。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。最近,国际权威机构囊淮胃呒都际醯鞑榻萃诰蚝腿斯ぶ悄芰形!拔来三到五年内将对工业产生深远影响的五大关键技术”之首,并且还将并行处理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前两位。价值的新知识的过程。由于文本型数据的快速增长,文本挖掘的重要性也日益增强。同时由于文本数据具有不同于一般数据的无结构或半结构化、高维数等特点,原来的数据挖掘算法不一定再适合于文本挖掘。目前,文本挖掘已经成为数据挖掘的一个重要研究分支。动态性,传统的数据挖掘算法往往对此无能为力,而以神经网络、粗糙集、模糊逻辑和遗传算法为主要组成部分的软计算,通过协同工作提供一种灵活的处理此类数据的能力。粗糙集理论作为一个处理不确定、不精确、不完备信息的数学工具,在人工天津大学博士学位论文本章首先介绍选题的研究背景和意义;然后对数据挖掘和文本挖掘的重要概念、过程、技术进行阐述;接下来熏点论述了粗糙集的基本概念及其在数据挖掘和文本挖掘中的应用:最后介绍了本论文的主要工作和未

基于粗糙集的数据及文本挖掘方法的研究(可复制毕业论文) 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数102
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mkt365
  • 文件大小0 KB
  • 时间2014-01-10
最近更新