PageRank 算法介绍程苹 cp2phi@ 目录?背景介绍?Google 的网页排序?PageRank 简化模型?PageRank 随机浏览模型?PageRank 的计算背景介绍 Web 上超链接结构是个非常丰富和重要的资源,如果能够充分利用的话,可以极大的提高检索结果的质量。 Sergey Brin (谢尔盖·布林)和Lawrence Page (拉里·佩奇)在1998 年提出了 PageRank 算法,同年 J. Kleinberg (J·克莱因伯格) 提出了 HITS 算法 Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd, 'The PageRank Citation Ranking: Bringing Order to the Web', 1998, http://www- /~backrub/ 为了更高效地计算 PageRank, 以下是改良以后的一篇论文。 Taher H. Haveliwala, ‘putation of PageRank ’, Stanford Technical Report, 1999, :8090/pub/1999-31 PageRank(TM) 是美注册商标。 Google 查询过程 Google 查询的全过程通常不超过半秒时间,但在这短短的时间内需要完成多个步骤,然后才能将搜索结果交付给搜索信息的用户。 PageRank? Pagerank 创始人:拉里佩奇(Larry Page )—Google 创始人之一应用:是 Google 用来衡量一个网站的好坏的唯一标准。?PageRank 的提出?Google 的创始人之一 Larry Page 于1998 年提出了 PageRank ,并应用在 Google 搜索引擎的检索结果排序上,该技术也是 Google 早期的核心技术之一?Larry Page 是Google 的创始首席执行官,2001 年4月转任现职产品总裁。他目前仍与 Eric Schmidt 和Sergey Brin 一起共同负责 Google 的日常运作。他在斯坦福大学攻读计算机科学博士学位期间,遇到了 Sergey Brin , 他们于 1998 年合伙创立 Google 。目录?背景介绍?Google 的网页排序?PageRank 简化模型?PageRank 随机浏览模型?PageRank 的计算 Google 的网页排序?在Google 中搜索“体育新闻” Google 的网页排序?在Google 中搜索“体育新闻”?搜索引擎工作的简要过程如下?针对查询词“体育新闻”进行分词——》“体育”、“新闻”?根据建立的倒排索引,将同时包含“体育”和“新闻”的文档返回,并根据相关性进行排序?这里的相关性主要是基于内容的相关性?但是会有一些垃圾网页,虽然也包含大量的查询词,但却并非满足用户需要的文档,如下图,一个网页中虽然出现了四次“体育新闻”但却不是用户所需要的?因此,页面本身的重要性在网页排序中也起着很重要的作用查询词和文档的相关性 Google 的网页排序?在Google 中搜索“体育新闻”
pagerank算法讲解 来自淘豆网m.daumloan.com转载请标明出处.