哈尔滨工程大学
硕士学位论文
基于粗糙集的Web日志挖掘研究
姓名:刘明刚
申请学位级别:硕士
专业:计算机应用技术
指导教师:吴继娟
20080901
摘要不断发展的拉近了人们彼此之间的距离,但是系暮A啃此,运用数据挖掘技术获取用户的访问信息对网站的生存是十分有利的。目前,萃诰蛑饕<性谖谋尽⒊谋疚牡怠⒘唇咏峁挂约癢日志文衿魅罩疚募钦鯳数据挖掘的重要数据来源。局蟹浅清楚地汜录了网站访问者的汶览行为并反映出各类用户浏览网站的习惯。本文研究并总结了国内外罩就诰虻南肿床⑻岢隽艘恢掷么植诩砺生成规则的罩就诰蚣际酢4植诩砺郾坏弊饕恢质视糜诓煌暾筒蝗定系统的知识发现的数学工具,在粗糙集理论的基础上,本文深入研究了连关于属性的离散化,本文主要讨论了算法和逻辑运算与粗糙集理论相结合的离散化算法,并对几种离散化算法做同的算法又会导致后面约简结果产生很大的差异。约简算法包括:基于差别矩阵和逻辑运算的属性约简算法、具有回溯功能的逻辑差别矩阵约简算法、启发式属性约简算法。同时本文也讨论了各种算法的优缺点。其中具有回溯功能的逻辑差别矩阵约简算法和启发式属性约简算最后将提出的启发式约简算法应用于镜拇怼F洳街栉J紫忍出就诰虼植诩P停黄浯瓮ü粜缘睦肷⒒砟?榈玫嚼肷⒒关键词:数据挖掘;罩荆淮植诩焕肷⒒皇粜栽技息却又逐渐地让人们变得无所适从,而这些信息又在不断地增加和改变。因件的研究上。续属性的离散化算法以及基于粗糙集理论的几种属性约简算法。算法、了比较。比较发现针对不同的数据集需要选用不同的离散化算法,而选取不基于粗糙集理论的属性约简算法的研究是本文的重点。本文主要讨论的法是本人在基本约简算法的基础上提出的改进算法。属性值;最后进行属性约简得到决策规则。关于离散化处理和规则获取,本文都给出了详细的流程图。哈尔滨下稃人学硕十学位论文
.·,’琤甊瑃.,琒’¨阤
.,哈尔滨下程大学硕十学位论文琲:.甧瑃瓺琑珼珹
作者┳:立却蜱哈尔滨工程大学学位论文原创性声明日期:圳罗年彳月日本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体己经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
第滦髀研究的背景及意义萃诰虻谋尘凹肮⒀芯肯肿的数据资源提供了开放的访问接口,实现了信息的大范围共享。今天,殉晌A送缧畔⒌幕∑教ǎ坏ù娣帕舜罅康钠笠怠⒄些都促使械氖萘砍时ㄐ栽龀ぃ娑源罅康腉丁渡踔粮随着计算机技术的不断发展,计算机在社会各领域的广泛深入应用,数量日益增长的各种数据成为当今数字化社会的宝贵资源,同时又对数据的处理与共享提出了严峻的挑战。⒘薟保婧蠛芸斓玫广泛应用。际跫ù笸贫薎的发展,成为了疘钪饕的信息服务。际醯某鱿植坏ǜ谋淞送绲挠τ梅绞剑S没峁┝擞押梅问试吹拇翱冢匾5氖撬峁┝巳碌耐缧畔⑵教ǎH蚬憷府机关的数据,而且成为了个人信息系,钠教ǎ的数据,如何有效地提取出其中蕴含的有价值的知识和信息就变得具有重要意义。在这样的背景下,产生了萃诰蚣际酢@肳数据挖掘技术可以从葜蟹⑾钟没Ц行巳さ男畔ⅰ8佟⒎治鲇没У姆梦誓J剑镏没Ц有效的浏览广阔的目前,萃诰蚣际醭晌A薟信息发现研究方面一个重要的课题,是一个新兴的具有广泛应用前景的研究领域。它可以广泛的应用在搜索引擎、智能查询、个人网络助理等网络信息发现领域箍梢园镏镜墓芾碓备玫墓理自己的网站,帮助用户更有效的浏览数据挖掘被视为一项回报率极高的重要应用技术。学术界和产业界对其高度重视,世界各国都投入了大量的人力物力进行研究、开发,目前已取得了一定的进展,其研究和应用前途不可限量。萃诰虻谋尘哈尔滨檀笱妒垦宦畚
不仅如此匣褂胁簧俚腒电子出版物,其中以半月刊Ⅺ如淮适状纬鱿衷昃傩械牡旃柿:先斯ぶ悄苎趸嵋椤啊希纷开辟了ㄌ饣蜃ǹ腒并且在年人们在美国计算机年会“,识发现列为议题之一,晌5讣扑慊蒲Ы绲囊淮笕鹊恪具软件和典型的样本数掘库,供人们测试和评价。长,人们不得不花费大量的时间去搜索自己需要的信息。尽管传统的搜索引擎和甒挖掘的现状数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。还有很多和这一术语相近似的术语,如从数据库中发现知识,、数据分析、数据融合以及决策支持等。上首次提出数据挖掘的概念。迄今为止,已经召开了多次由美国人工智能协会主办的恃刑只幔婺S稍吹淖ㄌ馓致刍岱⒄沟焦学术大会,研究重点也逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。其他
基于粗糙集的Web日志挖掘研究 来自淘豆网m.daumloan.com转载请标明出处.