下载此文档

基于本体的面向农业领域的分布式海量资源整合方法.pdf


文档分类:IT计算机 | 页数:约63页 举报非法文档有奖
1/63
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/63 下载此文档
文档列表 文档介绍
摘要针对农业领域知识资源的数量巨大和海量数据整合的需求,以及传统的数据检索如基于关键词检索的缺点,本文针对文本资源的语义性,引入本体的概念,对农业领域内的知识进行建模。本文提出了一种词语一概念映射方法,该方法利用概念一文档与词语一文档两重关系,计算出词语与概念的相关度与置信度,再实现词语集到本体知识片段的映射。词语一概念映射是语义检索中的重要一环,对查准率及查全率有着很大的在此基础之上,本文针对已有的海量资源整合相关技术进行了研究,并根据已有方法,对于特定本体三元组标注信息查询效率的提高这一问题,结合本体语义性以及缃峁梗岷鲜导是榭觯岢隽私诘阕试葱畔⒎植即娲⒌目蚣堋同时,提出一套方案以保证系统在演变过程中系统各节点数据的一致性及整个系中图分类号:影响。统的稳定性,最后通过实验证明该方案可行性。关键词:分布式系统本体语义三元组复旦大学硕士研究生毕业论文基十本体的面向农业领域的分布式海量资源整合方法
—.复旦大学硕士研究生毕业论文基于本体的面向农业领域的分布式海量资源整合方法琩猳瑆,—,猟—,琣琲琹琧瑆,琣:,,,,:
第一章引言研究背景相关问题的提出近年来,随着计算机产业的发展,网络在全球范围内的普及,各个领域内互人们可以通过网络检索到全球范围内的农业科技信息,同时也可以与世界各地的农业科研单位,院校以及农业从业者进行广泛的交流与信息共享。在我国,大型农业科学工程研究、农业信息服务和数字媒体应用中的数据资源目前『灾甘以及应用的投资花费已经超过数十亿。这些投资已经收到了一定的效果,许多成果已经广泛应用到全国各地的农业生产,养殖中去,并取得相当的成果。此外,科学的农产品经营方式也得到各地经营者的采纳,提高了农民的生产收入。但是随着科技水平的提高,目前的农业知识,资源及面向农业知识资源的服务框架开用户数据的进行挖掘的基础上,提高服务效果是目前农业领域各个应用急需解决随着语义网姆⒄梗涠孕畔⒓焖髁煊蛴辛私徊降耐贫饔茫车幕炸,互联网中充斥着各种形式各种结构的资源,基于关键词的检索速度将变得越来越慢,同时对网络上的资源进行索引也由于资源的异构性变得越来越困难。因此,如何将互联网中各种结构的资源有机的捏合在一起,是目前亟需解决的重要问题。另外,由于信息量的过于庞大,用户对信息检索的要求也越来越高,如何将检索中无用的信息过滤,提高检索的查全率和查准率也是目前信息检索领域的资源进行采集,分析和处理,并且推出了各种信息检索的服务。这种闭门造车式的方法在小范围内可以解决资源的共享及整合问题,但是由于各科研机构独立的研究行为导致在操作上,数据结构上互相的差异,此类做法无法解决诸如国家范围内乃至整个世界范围内的资源共享问题。联网资源成几何级数增长,例如,在农业领域内,农业科技信息资源日益丰富。的速度增长。此外,近数十年代以来,我国农业部已在农业知识资源的采集,分析,处理始逐渐无法满足广大用户的需求。因此在网络知识资源快速爆炸的前提下,如何将已有的资源整合起来,并且为用户提供良好的查询,推送等服务,同时在对于的问题之一。于关键词的信息检索方法已经越来越不能满足用户的需求。因为随着信息的爆热门研究课题之一。而在资源整合方面,目前已有一些机构针对特定领域,对领域内的各种知识复旦大学硕士研究生毕业论文基于本体的面向农业领域的分布式海量资源整合方法
本文主要工作户提出查询条件相符合的服务。通过分析已有的资源检索方法,可以发现目前的‘方法基本以基于关键词的匹配为基础,根据用户查询词语在互联网资源中进行文本匹配,根据其出现频度来进行相关度的排序。但该类方法忽略了词语多义词问导致检索结果中出现很多非客户所需要的资源,从而降低了查询结果的准确率。另外,现实生活中的实体有多个表示方法,如“番茄”与“西红柿”表达的同一件事物,当用户对“番茄”进行查询时,如果忽略了与“西红柿”相关的资源,那么对查全率也会造成影响。因此,本文考虑使用本体作为领域知识,来描述领域内的实体以及它们之间的关系,通过对实例属性与属性值的共现度的考量,减例亓F鹄矗庋吞岣吡讼低扯杂没氩檠氖挛锏娜范ㄐ浴W詈笸ü体三元组来得到相关的资源。在解决了如何提高用户查询与目标资源的对应性之后,基于目前我国乃至全本体视作三元组的集合,并根据三元组的散列值将对应标注结果分布至各节点之上以达到负载均衡的目的。我国目前各地的农业资源还处于相对孤立的状态,同时地区内部有较丰富、较全面的知识资源,但是地区之间的联系较少,导致资源存在一定的冗余性及差异性。并且由于节点众多,不便于统一管理,节点的不确通过检索系统匹配放可利用,为了解决减少对所有节点进行轮询而降低响应时间的问题,将本体转换成三元组集合,然后根据散列值将三元组的标注信息均匀分或前驱及后继信息发生错误时,能够自动触发修复机制,以完成对以上信息的重构,最后,无论在节点正常或

基于本体的面向农业领域的分布式海量资源整合方法 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数63
  • 收藏数0 收藏
  • 顶次数0
  • 上传人799474576
  • 文件大小0 KB
  • 时间2015-10-23