第 21卷第 1期 2007年 1月中文信息学报 JOURNALOFCHINESEINFORMATIONPROCESSING , Jan.,2007 文章编号:10032 0077 (2007 )012 01092 06 基于大规模日志分析的搜索引擎用户行为分析余慧佳 1,刘奕群 1,张敏 1,茹立云 2,马少平 1 (,北京 100084;,北京 100084 ) 摘要:用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近 5000万条查询日志进行了分析。我们从独立查询词分布、同一 session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义。关键词:计算机应用;中文信息处理;网络信息检索;搜索引擎;用户行为分析;点击信息分析中图分类号:TP391 文献标识码:A ResearchinSearchEngineUserBehaviorBasedonLogAnalysis YUHui2 jia 1,LIUYi2 qun 1,ZHANGMin 1,RULi2 yun 2,MAShao2 ping 1 (,TsinghuaUniversity,Beijing100084; &DCentre,Beijing100084 ) Abstract:mercialsearch ,wepresentsan analysisofSogouSearchEnginequerylogconsistingofapproximately50millionentriesforsearchrequestsovera ,userrequest informationretrievalalgorithmsandsearchperformanceevaluationmethods. puterapplication;Chineseinformationprocessing;webinformationretrieval;searchengine;user behavioranalysis;clickthroughdataanalysis 收稿日期:20062 072 26 定稿日期:20062 102 11 基金项目:国家重点基础研究(973 )资助项目(2004CB318108 );国家自然科学基金资
基于大规模日志分析的搜索引擎用户行为分析.pdf 来自淘豆网m.daumloan.com转载请标明出处.