中国科学院自动化研究所
硕士学位论文
基于概念网络的信息检索研究与开发实践
姓名:程盛远
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:杨一平
20040601
接要基破上豹囊然语言处理过程终了蒙旗分褥,试淹纛要分徐段瑚瀑次一词法、语随慧瓣络信息魏扩张,翔嚣挺翥谤惠检索系绞对巍然语言终楚璐娆力,成为研究热点。传统的基予关键溺字夏聪配的方式无法憋决复杂的语言关联问题,~些毅酶壹然璐言表达模型试强襄子镆骞叵担胰挥镅源σ际跏迪侄文本信息莳理解和检索。本文在分析已有模型秘方法的基础上,提出了基予溉念鄹终的接息检索愚想,基在采臻强然语言处毽技术鳐决硷豢系统文本分橱酾言知识表达方式,鼹予嗣法分搋、关联搜索、语义匹配与相苑⑹偷确焦俊⒋啪渴蒲腿毫烁拍钗恐征醣泶秣南担旄拍钲嘎绨杂栌②若鹪嫒挥锔恢识的表达。概念逑成为攒述语言关联王照象的蒸本孽位,按属性、关系和行为兰部分漾入分援了藏念的壤戒,不同黪壤念遗过关系帮行为焦嬖联系怒来戏为概念网络:分毒厅了基于概念网终进行馕息检索的可行性,对在此法、语义鞠语埔;初步构建了包含英诿掇念刚终在内的实验弼知识库。⒒谥J栋径嘤镅粤Хǚ衷1疚穆疚踝ɡ柘低初栋戳悖纺绶ǚ殖的知识组织成数据、知识库和控制三部分,建立了~套规则袭示与解释的枞制;嚣要时雄理撬获鼗攥麾讽爆矧识,实现了具体分辑规则熊内容与穗序的分离,使褥可以无需修改程序代码而蠢接向数据库添加、删除、筵新知识,运给系缭委耨带寒了方蠖;对于多谗言词法分撬衷讲,就可鹱达到在嗣一个糕裂肉使髑内蜜不同的词法分考厅知识的爵的。这个框架有渣能够以很,⒌拇鄯㈦斐傻乱ァ法语等嗣一瀑系的强法分辑嚣。⒒诟拍钔缛荡驶阋品⒓扑隳P汀I钊敕治隽四P偷慕峁估鲁桑究了模型豹不圈部分词性、鹜岽、撼黪彝谲义穗叛痿熬其俸实臻及冀棱心静概念两络搜索算法,模攫设计体璐了粳馑动态调整策略、关系晌不同处理方式。关键词:概念黼络,信息检索,鑫然澄富殛臻,词法分柝,籀似震词法和语义问题,既谣言单位的意义拍为棱心,梅建英语概念网络酏语论文的主要内容分为三部分:羹拍铄鲋站轱橐馑笏仨揖坑肟7⑹得
——.髓:::识..琣馈,也馈膇,瑆.:,,甌:甊。:瑀。瑂,’甤瓵.,:琁琋,甇
躲辜瞳喜一黜钆箍啤一样一一签名:轻鑫墨尹一日期:衅!关于论文使用授权的说明独创性声明本人声明所成交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知我一阉工У耐荻员狙芯克盏娜魏喂毕拙言诼畚闹凶髁嗣魅返厮得鞑⑸咽玖诵灰狻容,可以采瑁影印、臻印或箕毽复利手段镶存论文。C艿穆畚脑诮饷芎蠹佩嗍卮送Ф除了文中特别加以标注和致谢的地方外,浍文中不包含其他人已经发表或撰写过的研究成果。与本人完全了解中国科学院自动化研究所有关保留、使用学位论文的规定,即:中国科学院囱动他磅究赝有权镍警送交论文熬复印俘,允诲论文缓查阕和借阀;可以公布论文的全部或部分内
第一章绪论信患检索的婺>鸵丫锪亿个页瑶刂月H嗣且丫尚畔⑷活和工作中发挥了越来麓重要酶作磊,久翻越采趣多魏德劲它获联资源。出于本身的特点:开放性、动态性、异构性和分布式,没有也不可能有某个投藏租构对信怠耋行全露有效匏繁瑾稆爹唷e骰贼钤酉彭械如何迅速有效地从大量的数据中枪索出所需信息已经成为信息领域重要静、亟待解决静斑题,信息检索灌论与技术菰怒锤‘对这一运瑟发震怒来耱。旱在本世纪年代,当图书馆等部门用计算机表示存储和管理文档时,信息检索琁虢作为~令磅究锈壤应运葱生了。互联溺兹出现和迅猛发展,给传统的提供了一个前所未有的应用环境,产生了许多本文主鼹讨论畔⒓焖鳎虺莆猈,抛无特别说明本文中信息检索均系统一般可分为三类:信息检索⒃K阉饕妗⑺阉饕嬗肽柯肌信患检索窃H了饕婊蚪伥擎豹疆务,畿够学习麓户兴趣,浆黥网络信息,有变化时向用户报告。亩ㄒ迦允且桓鲂淳龅奈侍猓珹按术在撩多方藤存在争议,近年寒誉内出魏熬一些耩弱兴趣学习舞法,从客户端与服务器端两方考虑,利用了诸如疚募龋浞滞诰蛴没畔ⅲ詹年出现以来,不断发聪,已经成长为~个巨大的全球化信息空间。根掘的统计,年轮年录洌琁系闹鞣闶旷璋偻蛟龀ぜ欢谌收集的年以后乏的时代进入到了信息极大丰富的时代。互联网作为一个信息平台在人们的生无所适从,不知道如何去获取自己需要的内容。这就是所谓的“富数据穷信惑卑牾絒,信惑裣索系统,麴著名懿、、等。僵是缺乏系统应蔫稳评滚疲酰瑂冉』。/=鯥稽笫~章。
——~.苎雯塑查塑塑箜焦:垦楚室堑塞量堑垄壅些面临的问蹶和需要突破的方向—。目录元搜索引擎将用户的检索请求避行转换后提交割若干个独立的搜索引擎,弗把从各独立搜索引肇返回的所有查询结果,集中起来处理后再返回绘用户。实现简单,其局限在于;目前选择的搜索引擎数量有限,多数元搜索引擎都智辘访润少数尼个援索引擎;懑常不支持援索引擎的蔫缀
基于概念网络的信息检索研究与开发实践 来自淘豆网m.daumloan.com转载请标明出处.