下载此文档

搜索引擎和淘宝搜索不得不说的故事.pdf


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
连衣裙包邮!!
买个iphone5!
送女朋友什么
手机大甩卖!!
裙子好呢?
牛仔裤清仓买
一送一!!
…… …… …… ……
 数据量大:8: 8亿
 数据更新量大: 2亿/天
 查询量大: 3-4亿PV/天
 查询准确率要求高——对买家负责,降低查找成本
 查询召回 率要求高——对卖家负责,让每个宝贝 搜
索可达
 业务逻 辑复杂:属性信息远 大于 倒排信息
数据量(单位:M)
1000
800
600
400
200
0
2010年 2011年 2012年 2013年现在
PV(单位:M)
350
300
250
200
150
100
50
0
2010年 2011年 2012年 2013年
淘宝网 商城 一淘网
未来
2003年 2008年 2012年
解决搜索功能
解决容量速度
业务逻辑分离
业务引擎分离
引擎平台统一
 不断增长的搜索
 复杂多变的业务
 数据量日益增长
 庞大的属性信息
 频繁地数据更新
 灵活的运帷平台
每年痛并快乐着的大促(1111/1212)
——爆发式流量增长和更新量增长
 关联非引擎服务(UPS、QP、Forest etc.)
 多路数据混排(同构数据、异构数据)
 搜索结果RkRerank
 其他各种“异想天开”的业务逻辑
 统一 服务入口
 Build插件:允许对建索引的原始文档进行加工
 分词插件: 控制检索粒度
 QRS插件:改写Query定制业务逻辑、改写结果满
足业务需求
 属性信息定制化:直接使用Attr(i)(price)、简单表达
式(price+postage)、插件化()
 Scorer插件:特殊的属性信息定制化功能
 丰富的配置接口

搜索引擎和淘宝搜索不得不说的故事 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人流金岁月
  • 文件大小2.81 MB
  • 时间2021-09-03
最近更新