2022年搜索引擎发展史搜索研究教程
搜寻引擎发展史 1990年以前,没有任何人能搜寻互联网。 全部搜寻引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deuts出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。其设想是,既然全部网页都可能有连向其他网站的链接,那么从一个网站起先,跟踪全部网页上的全部链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜寻引擎起先纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 高校Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。JumpStation和WWW Worm只是以搜寻工具在数据库中找到匹配信息的先后次序排列搜寻结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜寻引擎,也是第一个在搜寻结果排列中引入关键字串匹配程度概念的引擎。
Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)高校生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上运用的搜寻软件版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜寻著名,2022年5月,被Infospace收购的Excite停止自己的搜寻引擎,改用元搜寻引擎Dogpile)
1994年1月,第一个既可搜寻又可阅读的分类书目EINet Galaxy(Tradewave Galaxy)上线。除了网站搜寻,它还支持Gopher和Telnet搜寻。
1994年4月,Stanford University的两名博士生,美籍华人/">Jerry Yang(杨致远)和David Filo共同创办了Yahoo(Jerry Yang Alerts a Usenet group to the Yahoo Database ,/">1996年的Yahoo)。随着访问量和收录链接数的增长,Yahoo书目起先支持简洁的数据库搜寻。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜寻引擎,事实上只是一个可搜寻的书目。Wanderer只抓取URL,但URL信息含量太小,许多信息难以单靠URL说清晰,搜寻效率很低。Yahoo!中收录的网站,因为都附有简介信息,所以搜寻效率明显提高。(注:Yahoo以后接连运用Altavista、Inktomi、Google供应搜寻引擎服务)
1994年初,Washington高校CS学生Brian Pinkerton起先了他的小项目WebCrawler(Brian Pinkert
2022年搜索引擎发展史搜索研究教程 来自淘豆网m.daumloan.com转载请标明出处.