下载此文档

浅析网页搜索引擎的PageRank排序算法.doc


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
浅析网页搜索引擎的PageRank排序算法.doc浅析网页搜索引擎的PageRank排序算法
摘要 技术的快速普及和迅猛发展,Web 上信息总量日益膨胀。用户如何从网页信息中快速获取所需信息变得日益重要。本文对Web结构挖掘算法PageRank 算法进行研究学习,分析了其两种算法的基本思想和技术特点。
关键词排序 PageRank算法随机游走
中图分类号:TP393 文献标识码:A
1 PageRank算法概述
PageRank(网页级别),2001年9月被授予美国专利,专利人是Google创始人之一拉里?佩奇[1]。它是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。级别从0到10级,10级为满分。
2 PageRank算法过程分析
PageRank算法所建立的用户浏览模型被称为“随机游走”(random walk)模型。用户使用一个特殊的浏览器来浏览网页,这个浏览器没有地址栏、后退按钮,即只能顺着网页链接浏览。同时提供一个“随便逛逛
”的功能,可以通过点此按钮随机打开万维网上的一个网页开始浏览。那么,网页A被访问的概率可以用如下公式计算得到:
上式右半部分是使用“随便逛逛”功能访问到页面A的概率,而后半部分则是使用超链接访问到页面A的概率,两者相加即为访问到页面A的总概率大小。可知,如果给定参数,页面A的PageRank值事实上是由链接到它的各个页面的PageRank值决定的。
3 PageRank算法
PageRank算法要求G中不存在没有超链接的“死胡同”网页,为解决这一问题,可以采用如下算法:
(4)当结果向量收敛时,返回(3)继续循环;当收敛时,算法结束,输出所计算出的G

浅析网页搜索引擎的PageRank排序算法 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ying_zhiguo02
  • 文件大小22 KB
  • 时间2017-08-26
最近更新