下载此文档

搜索引擎.pptx


文档分类:IT计算机 | 页数:约22页 举报非法文档有奖
1/22
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/22 下载此文档
文档列表 文档介绍
搜索引擎
Made by
1
Contents
搜索引擎技术发展
搜索引擎的核心问题
搜索引擎架构
云计算与云存储
4
1
2
3
2
搜索引擎技术发展
Title in here
不同用户输入相同的关键词,产生不同的结果
用户中心一代
文本检索的一代
布尔模式,向量空间模型,概率模型
史前时代
第一代
第二代
第三代
链接分析的一代
利用网页之间的关系,挖掘网页代表的含义
分类目录的一代
书本目录,人工处理
3
: 搜索引擎的核心问题:
用户需要
什么?
那些信息是用户需要的?
那些信息是用户可以信赖的?
更快,更全,更准
搜索引擎的目的
4
搜索引擎架构
5
: 网络爬虫:
互联网数据量过大——如何设计出高效的下载(信息获取)系统一个自动下载系统
6
网页去重:
7
方案二:由100个人分别算乘法,然后算加法
将一个运算量极高的任务分解,然后利用多台计算机
同时计算,去完成高性能任务——云计算
方案一:由一个数学天分极高的教授去算全部
8
同一数据在不同的机器节点上可
能不一致(云计算很难用到银
行证券等行业)
.
不需要中断用户的操作即可添加增加机器
大量廉价的PC(电脑),构成
.
每一台机器为一个节点,多台机器一起组成的分布式计算
大量廉价的电脑构成
水平增量式扩展
以单个的机器作为的节点
数据一致性差
: 云计算与云存储:
9
数据一致性差
: 云计算与云存储:
10

搜索引擎 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数22
  • 收藏数0 收藏
  • 顶次数0
  • 上传人274030239
  • 文件大小829 KB
  • 时间2021-07-27
最近更新