下载此文档

基于模糊信息处理的个性化文件搜索引擎算法研究与实现(可复制论文).pdf


文档分类:IT计算机 | 页数:约86页 举报非法文档有奖
1/86
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/86 下载此文档
文档列表 文档介绍
摘要在快速进步的信息时代,人们在快速的生活节奏中能以很简单的方式用搜索引擎能够在茫茫互联网中找到较为准确的用户所需要的信息。在最近几年中,搜索引擎正在飞速发展。同时桌面搜索引擎也有了较为快速的发展。但在为用户提供个性化的服务方面还没有达到用户的要求,它们仅仅是找到用户的文件并作一些简单处理,在用户文件中所蕴含的知识的分析、聚合及潜在的知识的挖掘、搜索结果人性化展示等方面的功能有所欠缺。这几点正是本文的重点研究对象。本文的工作源于四川省青年软件创新基金资助项目—甤,主要提供用户知识挖掘及管理、个性化搜索、用户兴趣学习及用户个性化服务等。本文主要工铀阉饕娴幕靖拍罴袄烦龇ⅲ治隽俗烂文件阉饕娴姆展及长短处。:畔⒋淼母鲂曰分布式文件搜索引擎的基础理论,提出了基于并性模糊模糊蚂蚁的聚类算法、基于的中文分词算法及全新的用户模型等;在从理论角度研究相关模型和算法的同时,也采用了大量的数据及测试工具,对相关模型和算法作了较为详细的测试,进而验证算法和模型的准确性与高效性;由杓坪褪迪值慕嵌茸髁私衔O晗傅墓ぷ鳌V饕2捎米远ハ蛳碌姆绞剑从系统架构到各个模块,再到各个软件包的设计,整个系统层次分明、结构清晰。主要包括:整个系统的架构、聚类算法的设计与实现、中文分词算法的实现、全新的用户模型的设计与实现及并发文件蜘蛛的设计与实现等:捎枚喔龉ぞ呓辛讼喙夭馐裕ǎ汗δ懿馐浴⒀沽Σ馐缘龋煌辈用/哉鱿低辰辛诵阅芊治龊陀呕谧芙岜疚哪壳暗耐瓿傻墓ぷ鞯那榭鱿拢院笮ぷ饕沧隽思蛎鞣治黾关键词:个性化,搜索引擎,模糊蚂蚁,文本聚类,用户兴趣挖掘作如下:展望。
知识水坝***@pologoogle为您整理
,删∞,磂侣’停醩蕍缸耾瑂ィ幅’﹑趾夼蒻唱盯蚻総磂玛丽甌、釉南—∞噦辵也瑂骯∞辮鷋∞瓵鑟甌辴髂谴髂雒膇,譭誧勰閐【膇;∞,【£盯;甌簍謈舀幻瑃Ⅱ‘.
知识水坝***@pologoogle为您整理
签名:.之困日期:切晔痹旅独创性声明关于论文使用授权的说明本人声明所里交的学位论文是本人在导师指导下进行的研究工一作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笥ψ袷卮斯娑签名:
—,其权威性高于其它诸如://。搜索引擎的基本概念第一章绪论信息的生产、传播、搜集与查询是人类最基本的活动之一。考虑以文字为载体的信息,传统上有图书馆、相应的编目体系和专业人员帮助我们很快找到所需的信息,其粒度通常是“书”或者“文章”。随着计算机与信息技术的发展,有了信琁学科领域,有了关于图书或者文献的全文检索系统,使我们能很方便地在“关键词”的粒度上得到相关的信息。搜索引擎,是指因特网上专门提供查询服务的一类网站,是一种利用网络自动搜索技术,对因特网各种信息资源分门别类地进行标引建库,能够对检索者提出的各种检索查询做出响应的强有力的检索工具。它是为满足人们对网络信息搜索需求应运而生的网络工具,既是互联网信息查询的导航针,也是沟通用户与网络信息的重要桥梁【俊4邮褂谜叩慕嵌瓤矗庵秩砑低程峁┮桓鐾辰缑妫盟过浏览器提交一个词语或者短语,然后返回一个可能和用户输入内容相关的信息列表。此列表通常以分页且每页中包含有限数量条目的形式来表现。每一条目代表一个网页,至少包含三个元素:≯标题网页内容的标题性概括。获得标题的方式不唯一,其中最简单的方式就是从网页的头信息中提取的内容。它是否能准确反映该网页的内容,取决于网页设计者对标题的概括。该网页的原始地址。该地址可能反映出该网页的一些特点。如:政府网站,且为中国政府的某个子网站,其内站。同时根据网址的后缀可大概判断该网页的类型,比如:硎咀橹网页内容的简要概括。最简单的一种方式就是将网页内容的头截取部分数据作为摘要。息检索R》
用户通过浏览网页的以上元素,进而判断是否真正包含其所需的信息。若用户根据上述三个因素判断出某个网页可能会符合其要求,则用户可点击相应的访问该网页。图是年赵谒阉饕鍳浴癑弊魑关键字搜索返回给用户的部分信息列表。列表中每一条目所含内容比上述要丰富些,但上述三个元素依旧是核心。虽然关键字相同,不同的搜

基于模糊信息处理的个性化文件搜索引擎算法研究与实现(可复制论文) 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数86
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mkt365
  • 文件大小0 KB
  • 时间2013-11-11