下载此文档

最新着互联网的高速发展.doc


文档分类:研究报告 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
several group number, then with b ± a, =c,c is is methyl b two vertical box between of accurate size. Per-2~3 measuremenm等计算机软件程序生成的数据库,这些程序能够自动在因特网上漫游,网罗各类新网址及网页,最终生成能被用户获取的数以千万甚至上亿条记录。这样一来,通过采集标引众多网络站点,搜索引擎就形成了一种全局性网络资源控制与检索机制,它将全球WWW网络中所有信息资源作一完整的集合,整理和分类,实现了用户网络检索所需信息的方便快捷。因而,搜索引擎具有检索面广,信息量大,信息更新速度快等特点。
论文首先介绍了搜索引擎的历史和现状,对它的不同开展阶段的形式和特点做了一个简单的介绍。接着对搜索引擎的原理、系统结构等方面进行了一定的研究,并对作为搜索引擎技术根底的信息检索模型和、文本信息检索技术和中文分词技术做了详细论述。在此根底上对开源代码工程Lucene的历史,应用,特点,系统结构做了分析。接下来对网络爬虫Heritrix进行了深入的分析,对各个核心部件进行了详细介绍。最后构建了一个搜索引擎实例,并进行了演示。

90年代以后互联网的迅速兴起,一方面使人们更加方便地获得信息,另一方面也更一步加快了信息的产生。尤其随着web技术的成熟化和Internet的商业化,网络向人们提供的信息量越来越大,网上的信息几乎是呈指数级增长。
在信息大爆炸时代,全球信息量每隔20个月就增加一倍,而这个增长速度还会进一步增加,信息增长呈现速度惊人、来源广泛、种类繁多、数量巨大的特点。据统计,2022年全球制造、复制出的数字信息量共计1610亿GB,标志人类进入了前所未有的信息增长时期。这些数字信息大约是现有书籍所含信息的300万倍,如果将书籍排列起来,总长度为地球到太阳距离〔〕的12倍。IDC报告指出,至2022年,这个数字将猛增到6倍,达9880亿GB,年复合增长率为57%[1]。面对极度膨胀的信息量,人们感受到“信息爆炸〞、“混沌信息空间〔Information Chaotic Space〕〞和“数据过剩〔Data Gult〕〞[2]的巨大压力。
several group number, then with b ± a, =c,c is is methyl b two vertical box between of accurate size. Per-2~3 measurement, such as proceeds of c values are equal and equal to the design value, then the vertical installation accurate. For example a, b, and c valueswhile on horizontal vertical errors for measurement, General in iron angle code bit at measurement level points grid errors, specific method is from baseline to methyl v

最新着互联网的高速发展 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人916581885
  • 文件大小24 KB
  • 时间2022-07-27