劣妻未交堙篱硕士学位论文罩局杏没捣狈梦事肪锻诰蛩惴ǖ难芯北京交通大学作者:导师:张骏温王慧月’’’
乏从幻涉签字醐吻,,“月≥毽签字日期:沙辍虑腥学位论文版权使用授权书≯一本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得学位论文作者签名:导师签名:
北京交通大学硕士学位论文罩局杏没捣狈梦事肪锻诰蛩惴ǖ难芯学科专业:计算机科学与技术作者姓名:王慧导师姓名:张骏温学位类别:工学学号:职称:副研究员学位级别:硕士研究方向:计算机应用月中图分类号:学校代码:密级:公开.’
致谢本论文的工作是在我的导师张骏温副研究员的悉心指导下完成的,张骏温老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来张骏温老师对我的关心和指导。张骏温老师悉心指导我们完成了实验室的科研工作,在学习上和生活上都给予了我很大的关心和帮助,在此向张骏温老师表示最衷心的感谢和最诚挚的敬意。在实验室工作及撰写论文期问,匡寅佳、戴雪梅和沈海利等同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。另外也感谢父母和妹妹,他们的理解、关心和支持让我顺利度过人生中遇到的一次次难关,使我能够在学校专心完成我的学业。最后,衷心感谢各位专家百忙之中对本文的审阅和赐教。
中文摘要摘要:随着网络的飞速发展,商务网站逐渐增多。如何根据用户的行为习惯,优化网站结构或主动地为用户提供一些个性化服务,成为了困扰网站管理者的主要难题,罩就诰虻某鱿治=饩稣庖晃侍庵该髁诵碌姆较颉W魑猈挖掘里的一个重要分支,罩就诰蛞丫晌5鼻把芯康娜鹊恪罩就诰蚴墙ù呈萃诰蚣际踉擞玫絎日志中,来发现用户访问站点的行为模式和兴趣爱好,以及分析站点的使用情况。本论文深入研究了从日志中挖掘用户频繁访问路径。首先,针对数据预处理进行了深入研究,其中在会话识别阶段引入了页面层次的概念,使页面浏览时间阈值的确定更加准确;随后对事务识别进行了改进,提出了算法,该算法将路径补全和事务识别合并为了一步,简化了数据的预处理操作。然后,作者深入研究了两类频繁路径挖掘算法,有候选集产生的算法和无候选集产生的算法。其中,重点研究了无候选集产生算法中的惴ǎ⒃赪算法基础上提出了一种改进算法,该算法通过前序遍历号和后序遍历号来跟踪候选序列分布在哪些子树中,从而避免了物理条件树的构建。最后,作者编程实现了一个疭结构的就诰蛟拖低常低巢捎昧改进的事务识别算法和频繁路径挖掘算法来发现用户的频繁访问路径。除此之外,该系统还可以发现一些常规模式,例如,最受欢迎的页面、用户来源等。论文对改进算法及挖掘系统进行了详细的测试,并对测试结果进行了较为详细的分析和总结。关键词:罩荆菏萃诰颍恍蛄心J剑黄捣甭肪叮籛算法
琣,甌.:甆;.—’瓵,’,;甌瑆疭籇琽
目录中文摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。论文的研究内容及创新点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..罩就诰虻南喙乩砺邸诰颉诰蚨ㄒ濉诰蚍掷唷罩就诰颉罩就诰虻母拍睢就诰虻墓獭罩就诰虻姆椒ā罩就诰虻挠τ谩本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯就诰虻脑ご怼预处理的概念及总体流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据转换⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据清洗⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯用户识别⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯会话识别⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯事务识别⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.慕氖挛袷侗鹚惴↖⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.
本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯用户频繁访问路径的挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯序列模式的相关概念⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯频繁路径挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.泻蜓〖〖∟.⒒肪臣蚪椤原型
Web日志中用户频繁访问路径挖掘算法研究 来自淘豆网m.daumloan.com转载请标明出处.