经济学论文信息搜索引擎综述及系统架构设计.doc信息搜索引擎综述及系统架构设计信息搜索引擎综述及系统架构设计是小柯论文网通过网络搜集,并由木站工作人员整理后发布的,信息搜索引擎综述及系统架构设计是篇质量较高的学术论文,供本站访问者学习和学术交流参考之用,不可用于其他商业目的,信息搜索引擎综述及系统架构设计的论文版权归原作者所有,因网络整理,有些文章作者不详,敬请谅解,如需转摘,请注明出处小柯论文网,如果此论文无法满足您的论文要求,您可以申请木站帮您代写论文,以下是正文。[摘要]本文介绍了搜索引擎的发展与分类,给出了一种搜索引擎的架构并对各个组成部分进行了分析,最后分析了如何来评价搜索引擎性能的技术指标。「关键词]搜索引擎发展分类技术指标一、 引言互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天,很多人都会选择一种更方便、快捷、全面、准确的方式——使用搜索引擎。二、 搜索引擎的历史20世纪90年初,当时万维网(WorldWideWeb)还未出现,为了杏洵散布在各个分散的主机中的文件,曾有过Archie,Gopher等搜索工具,随着互联网的迅速发展,基于HTTP访问的web技术的迅速普及,它们就不再能适应用户的需要。1994年,Lycos推出了基于Robot的数据发现技术。1998年10月,Google诞生,它是目前最流行的搜索引擎之一,具备很多独特而且优秀的功能,并且在界面等方面实现了革命性创新。三、 搜索引擎的分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类。但各种搜索引擎站点正在结合其他搜索引擎的优点,在类型上有逐渐融合的趋势。目录式(Directory)搜索引擎。以人工方式或半日动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护最大、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!(dir.)和OpenDirectoryProject(wvvw.)。基于机器人(Robot-based)的搜索引擎。基于机器人的搜索引擎是一种典型的搜索引擎。由一个称为爬虫(Spiders或robots)111搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返IE给用户。该方式力求能够对领域,然而由于只能对代表是:Google(),国内的有百度(。元搜索引擎(Meta-searchengine)o元搜索引擎的基本思想是:当搜索引擎受到来自客户的查询请求后,自动将这些查询请求转发给其它多个搜索引擎,并将各搜索引擎返回的杳询结果收集起来进行处理,最终提供给用户。这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返I门I的结果进行重发排除、重新排序等处理后,作为自己的结果返I可给用户。。四、 搜索引擎基本组成搜索器。中漫游,发现和搜集信息。搜索器搜集的信息类型多种多样,包括HTML文木、XML文木、Newsgroup文章、FTP文件、字处理文档(如Word,Postscript,PD
经济学论文信息搜索引擎综述及系统架构设计 来自淘豆网m.daumloan.com转载请标明出处.