连衣裙包邮!!
买个iphone5!
送女朋友什么
手机大甩卖!!
裙子好呢?
牛仔裤清仓买
一送一!!
…… …… …… ……
数据量大:8: 8亿
数据更新量大: 2亿/天
查询量大: 3-4亿PV/天
查询准确率要求高——对买家负责,降低查找成本
查询召回 率要求高——对卖家负责,让每个宝贝 搜
索可达
业务逻 辑复杂:属性信息远 大于 倒排信息
数据量(单位:M)
1000
800
600
400
200
0
2010年 2011年 2012年 2013年现在
PV(单位:M)
350
300
250
200
150
100
50
0
2010年 2011年 2012年 2013年
淘宝网 商城 一淘网
未来
2003年 2008年 2012年
解决搜索功能
解决容量速度
业务逻辑分离
业务引擎分离
引擎平台统一
不断增长的搜索
复杂多变的业务
数据量日益增长
庞大的属性信息
频繁地数据更新
灵活的运帷平台
每年痛并快乐着的大促(1111/1212)
——爆发式流量增长和更新量增长
关联非引擎服务(UPS、QP、Forest etc.)
多路数据混排(同构数据、异构数据)
搜索结果RkRerank
其他各种“异想天开”的业务逻辑
统一 服务入口
Build插件:允许对建索引的原始文档进行加工
分词插件: 控制检索粒度
QRS插件:改写Query定制业务逻辑、改写结果满
足业务需求
属性信息定制化:直接使用Attr(i)(price)、简单表达
式(price+postage)、插件化()
Scorer插件:特殊的属性信息定制化功能
丰富的配置接口
搜索引擎和淘宝搜索不得不说的故事 来自淘豆网m.daumloan.com转载请标明出处.