下载此文档

基于页面相似度的链接分析算法研究.pdf


文档分类:IT计算机 | 页数:约63页 举报非法文档有奖
1/63
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/63 下载此文档
文档列表 文档介绍
大连彼乡大学
硕 士 学 位 论 文
入顽
一一一一一一一扣卜一一一一一州
基于页面相似度的链接分析算法研究
软件工程
学科专 业
范鑫鑫
作者 姓名
指导教 师 江 贺
答 辩 日期 年 月 日
硕 士 学 位 论 文
基于页面相似度的链接分析算法研 究
作 者 姓 名
学科 、 专业
学 号
指 导 教 师
完 成 日 期
大连 理工 大学
大连理工大学学位论文独创性声明
作者郑重声明 所呈交的学位论文, 是本人在导师的指导下进行研 究
工作所取得的成果 。尽我所知, 除文中已经注明引用内容和致谢的地方外,
本论文不包含其他个人或集体 已经发表的研究成果, 也不包含其他 已申请
学位或其他用途使用过的成果 。与我一同工作的同志对本研究所做的贡献
均已在论文中做了明确的说明并表示了谢意 。
若有不实之处, 本人愿意承担相关法律责任 。
学位论文题目 务、 、偏、看酬裕落冷巧炼沐咐尾
作者签名 范 森 在 日期 砂 才 年州上三月」一日
大连理工大学硕士学位论文
冠石
摘 之
亡 为人们提供 了丰富的信 息资源 的同时 , 它所 具有 的海量数据 、 复杂性 、 极强 的
动态性和用户 的多态性等特 点也给 七 资源 的挖掘造成 了相 当的难度 。 由于 信息
是 自组织和半 结构化的 , 经 典的信 息检索和数据库技术很难得到有效 的应用 。超链接是
七 特有的组成部分, 是联系 乙 上数据资源的纽带 。链接分析是提高 匕 资源挖掘
质 量的重要途径 。
本文详细分析 了叭七 数据挖掘方法及 亡搜 索引擎的结构, 分析了 链接结构 的
特征及主流的链接分析算法的特点及存在的问题 。 肛水算法和 算法是两种典型
的基于链接分析的页面排序算法 。但是 算法同等对待网页间的链接, 没有考虑
网页更新 时间的重要性 、导航 网页 的影 响等 算法忽略 了主机之 间的多重加强关系 ,
容易发生主题偏移产生不合理结果以及不能满足用户站点粒度的信息需求等 。根据
链接特征 以及 网络冲浪者的浏览过程 , 可 以发现 网络冲浪者 的随机游走过程受当前页面
内容 的影响 , 通 常会跳转到 与当前页面 内容相关性很大页面 , 而不是等概率地 沿着 出链
跳转 。在此基础上 , 本文 引入 了 加 算法来定义 网页之 间的相似性 , 从而给 出了一
种基于网页间相似度权值分配模式, 对相关性大的页面间的链接赋予较大的跳转概率 。
利用此 分配模式我们提 出了一种基于分配 因子排序算法 水

基于页面相似度的链接分析算法研究 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数63
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wuxilove
  • 文件大小5.02 MB
  • 时间2021-11-13
最近更新