下载此文档

【精品】PPT课件 搜索引擎与宝贝搜索不得不说的故事.pptx


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
搜索引擎与宝贝搜索不得不说的故事
认识淘宝宝贝搜索
买个iphone5!
送女朋友什么裙子好呢?
手机大甩卖!!
连衣裙包邮!!
牛仔裤清仓买一送一!!
……
……
……
……
宝贝搜索
数据量大: 8亿
数据更新量大: 2亿/天
查询量大: 3-4亿PV/天
查询准确率要求高——对买家负责,降低查找成本
查询召回率要求高——对卖家负责,让每个宝贝搜索可达
业务逻辑复杂:属性信息远大于倒排信息
宝贝搜索的特点
宝贝搜发展史——数据量
宝贝搜发展史——查询量
淘宝网 2003年
商城 2008年
一淘网 2012年
未来
宝贝搜索发展史——大事记
C2C宝贝
C2C宝贝
B2C宝贝
C2C宝贝
B2C宝贝
全网购物搜索
一站式购物体验
发现
比较
优惠券
C2C宝贝
B2C宝贝
全网购物搜索
一站式购物体验
发现
比较
优惠券
个性化
协同搜索
淘宝搜索架构演变
解决搜索功能
解决容量速度
业务逻辑分离
业务引擎分离
引擎平台统一
不断增长的搜索
复杂多变的业务
数据量日益增长
庞大的属性信息
频繁地数据更新
灵活的运帷平台
每年痛并快乐着的大促(1111/1212)
——爆发式流量增长和更新量增长
搜索引擎面临的技术挑战
关联非引擎服务(UPS、QP、Forest etc.)
多路数据混排(同构数据、异构数据)
搜索结果Rerank
其他各种“异想天开”的业务逻辑
统一服务入口
解决之道——数据聚合层(SP/Agg)
Build插件:允许对建索引的原始文档进行加工
分词插件: 控制检索粒度
QRS插件:改写Query定制业务逻辑、改写结果满足业务需求
属性信息定制化:直接使用Attr(price)、简单表达式(price+postage)、插件化()
Scorer插件:特殊的属性信息定制化功能
丰富的配置接口
解决之道——灵活的配置/插件接口

【精品】PPT课件 搜索引擎与宝贝搜索不得不说的故事 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wo1230
  • 文件大小0 KB
  • 时间2014-12-11