下载此文档

基于用户兴趣的Web日志挖掘算法.pdf


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
万方数据
Web挖掘算法口士J计算机集成制造系统刘慧君,朱庆生,张程,周明强引言文奄编号:—Web泛应用,而每个镜愣际占撕A康腤日Web这些信息可以发现用户的浏览访问模式,揭示用户[1]]有价值的信息。Web过分析页面使用频度或页面停留时间作为用户的兴趣度,从而挖掘用户浏览兴趣模式。最大向前序列第卷第期厍齑笱Ъ扑慊г海厍Web选择及在页面浏览中表现出的兴趣,提出了路径选择兴趣度以及页面浏览兴趣度的概念。设计了路径选择兴趣矩阵和页面浏览兴趣矩阵。并基于两个矩阵,设计了浏览兴趣路径挖掘算法。该算法先通过对两个矩阵进行路r效性。web1摘TP393AMingqiang篧收稿日期:一一;修订日期:—一。基金项目:国家科技攻关计划重点资助项目唤逃坎┦康慊鹱手钅;重庆市科技计划资助项目;重庆市自然科学基金资助项目。(1975--)—琙ChengZHOU珻UniversityChongqing,:琤activitiesthe·—sub-pathsEffctivenessexperimentslogbrowsingpathsinterestmeasureminingalgorithme-businessMar2009篜珻畉珻(No20050611027)theChongqing珻瓹,FoundationChina(NoCSTC2008BB2042)猰簂甧.。essre-
万方数据
基本定义法Ⅲ根据用户折返的特性,形成若干浏览子序列;参1[6]念,并应用支持一偏爱度挖掘用户浏览偏爱路径。以上算法只考虑了使用频度或页面停留时间,认为用户的浏览次数或者浏览时间就反映了用户的访问兴趣,这是不够准确和全面的。一方面,访问页面的次数与页面在网站结构中所处的位置有关,一般越靠近主页的页面被访问的机率越高。一个页面具有的链接越多,它被访问的次数也应该是越多的,但这并不表示用户对这个网页有多大的兴趣,因为用户有可能只有通过这个页面才能链接到他所想要的网页。另一方面,用户停留时间长,但访问频率低说明页面位置需要调整或只有少数人感兴趣;用户停留时间短,但访问频率高说明用户对页面不感兴趣或页面位置需要调整。本文在分析用户访问行为的基础上认为:用户的访问兴趣必定能够通过他的行为表现出来,通过分析用户的行为,就可以判断出用户的兴趣所在,推断出用户在某一段时间内的浏览兴趣。因此,为了挖掘出大多数用户的浏览兴趣模式,本文设计了一Web(eXtensible,描述]表现出来的兴趣,设计了用户路径选择兴趣矩阵表示模型,以及页面浏览兴趣矩阵表示模型,实现一种web掘算法InterestwMAUBI)webG(TE)T={i蔥琁TI])ITINiiE={<i>IiJ[1I琲≠.『琲与歹1定义没巳ば形<疷是用户在访问页面上可能行为操作的集合,本文研究的用户兴趣行]对网页内容进行所有的点击操作,如最大化、最小化、点击网页中的、滚动鼠标、添加到收藏夹等。(2)作等。UBI={Maxi定义没г谕换峄癟中的访问过程可以atat={,,这里CUrlbehaviorUBIUrl2[9]的特点,再综合考虑不同的行为在网页上所蕴含的意义,以及

基于用户兴趣的Web日志挖掘算法 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人yzhluyin9
  • 文件大小0 KB
  • 时间2015-03-22