搜索引擎
Made by
1
Contents
搜索引擎技术发展
搜索引擎的核心问题
搜索引擎架构
云计算与云存储
4
1
2
3
2
搜索引擎技术发展
Title in here
不同用户输入相同的关键词,产生不同的结果
用户中心一代
文本检索的一代
布尔模式,向量空间模型,概率模型
史前时代
第一代
第二代
第三代
链接分析的一代
利用网页之间的关系,挖掘网页代表的含义
分类目录的一代
书本目录,人工处理
3
:搜索引擎的核心问题:
用户需要
什么?
那些信息是用户需要的?
那些信息是用户可以信赖的?
更快,更全,更准
搜索引擎的目的
4
搜索引擎架构
5
:网络爬虫:
互联网数据量过大——如何设计出高效的下载(信息获取)系统一个自动下载系统
6
网页去重:
7
方案二:由100个人分别算乘法,然后算加法
将一个运算量极高的任务分解,然后利用多台计算机
同时计算,去完成高性能任务——云计算
方案一:由一个数学天分极高的教授去算全部
8
同一数据在不同的机器节点上可
能不一致(云计算很难用到银
行证券等行业)
.
不需要中断用户的操作即可添加增加机器
大量廉价的PC(电脑),构成
.
每一台机器为一个节点,多台机器一起组成的分布式计算
大量廉价的电脑构成
水平增量式扩展
以单个的机器作为的节点
数据一致性差
:云计算与云存储:
9
数据一致性差
:云计算与云存储:
10
搜索引擎 来自淘豆网m.daumloan.com转载请标明出处.