2 2 2
2 2 2 2
第 21 卷第 1 期中文信息学报 Vol. 21 , No. 1
2007 年 1 月 J OU RNAL OF CHIN ESE IN FORMA TION PROCESSIN G Jan. , 2007
文章编号: 1003 0077 (2007) 01 0109 06
2 2 2 2
基于大规模日志分析的搜索引擎用户行为分析
余慧佳1 ,刘奕群1 ,张敏1 ,茹立云2 ,马少平1
(1. 清华大学智能技术与系统国家重点实验室,北京 100084 ; 2. 搜狗公司研发中心,北京 100084)
摘要: 用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各
种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近
5 000 万条查询日志进行了分析。我们从独立查询词分布、同一 session 内的用户查询习惯及用户是否使用高级检
索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都
有较好的指导意义。
关键词: 计算机应用;中文信息处理;网络信息检索;搜索引擎;用户行为分析;点击信息分析
中图分类号: TP391 文献标识码: A
Research in Search Engine User Behavior Based on Log Analysis
YU Hui jia1 , L IU Yi qun1 , ZHAN G Min1 , RU Li yun2 , MA Shao ping1
(1. Department puter Science and Technology , Tsinghua University , Beijing 100084 ;
2. Sogou R &D Centre , Beijing 100084)
Abstract : User log analysis is important for both Web information retrieval technologies mercial search
engine algorithms. In order to better understand search behavior of Chinese Web search users , we presents an
analysis of Sogou Search Engine query log consisting of approximately 50 million entries for search requests over a
period of one month. The analysis includes search retrieval behavior in individual queries distribution , user request
customs in the same session and whether using advanced search functions. Conclusions may help impr
基于大规模日志分析的搜索引擎用户行为分析 来自淘豆网m.daumloan.com转载请标明出处.