独创性声明 Y1879766 本人声明,所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文使用授权书期:丝!!:竺!!: 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即: 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有关机构或论文数据库使用或收录本学位论文,并向社会公众提供信息服务。(保密的论文在解密后应遵守此规定) 武汉理工大学硕士学位论文摘要互联网给人们的生活带来方便。然而,互联网上的数据是海量的,并急剧增长,要从浩如烟海的数据中,找到需要的信息,有时不是很容易。搜索引擎的出现,给人们带来了方便。传统搜索引擎已经很成熟,在商业上也取得了巨大的成功。然而,传统搜索引擎一般基于关键词进行匹配,没有充分使用用户的个性化信息,缺少个性化特征。为了解决这个问题,个性化搜索引擎出现了,使用了用户的个性化信息, 具有个性化特征,能满足用户的个性化信息需求。在本论文中,个性化搜索引擎是在传统搜索引擎的基础上,加入了个性化特征,以满足用户的个性化信息需求。个性化搜索引擎使用向量空间模型作为用户兴趣模型,描述用户的兴趣、行为。在个性化搜索引擎中,建立用户兴趣模型,更新用户兴趣模型,使用用户兴趣模型,对查询优化,对结果排序,实现个性化。用户兴趣模型是个性化搜索引擎实现个性化的关键,是本论文研究的关键。用户兴趣模型由特征项及其权值构成的向量表示。特征项及其权值可以描述用户的兴趣、行为。用户的兴趣、行为获取的方式有:注册用户提供兴趣关键词作为特征项,从用户输入的查询词提取特征项,通过用户点击从用户浏览的 Web文档中提取特征项。获取用户的兴趣、行为,建立用户兴趣模型。为了更好地描述用户的兴趣、行为,用户兴趣模型需要更新。用户兴趣模型可以用来对查询优化,对结果排序。对查询优化,对于用户,用户兴趣模型中的特征项按权值从大到小排序,列出权值较大的特征项供用户选择,将选择的特征项与用户输入的查询一起进行检索。对结果排序,对于用户,计算每一个Web文档与用户兴趣模型的相关度,对结果按相关度从大到小排序。在传统搜索引擎的基础上,使用Lucene框架,使用用户兴趣模型,用Java 实现了个性化搜索引擎PSE。个性化搜索引擎PSE使用了用户的个性化信息, 通过建立用户兴趣模型,更新用户兴趣模型,使用用户兴趣模型,对查询优化, 对结果排序,能满足用户的个性化信息需求。本论文的研究表明,在个性化搜索引擎中,使用用户兴趣模型,能满足用户的个性化信息需求。关键词:搜索引擎,个性化搜索引擎,用户兴趣模型,向量空间模型武汉理工大学硕士学位论文 Abstract Intemetbrings convenience ,data in isgiant,and is growing ,sometimes is noteasy tofind theinformation needed fromthe searchengineappears,which brings convenience topeople. The traditional search engine ismature,and gains agreat mercially. Howcvel',the traditionalsearchengine isgenerally based 011matching keywords,and littleusers’personalized information isconsidered,which islackofpersonalized tosolve theproblem,a personalized searchengine ispresented to make USC ofthepersonalized information,which haspersonalized featureand can meetusers’personalized informationneed. Inthisthesis,thepersonalized searelaengine isbased 011thetradit
个性化搜索引擎的研究与实现 来自淘豆网m.daumloan.com转载请标明出处.