下载此文档

浅论一种医疗本体语义相似度算法的设计.doc


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
浅论一种医疗本体语义相似度算法的设计
摘要:由于目前检索技术效率低下,所以需要一种基于本体的检索技术来提高效率。语义相似度计算是基于本体的检索技术的一个关键问题。本文对已有语义相似度计算方法进行总结并改进,最后对其进行分析。关键词:本体;本体检索;语义相似度计算 1 引言的日益发展和普及,本体在信息采集、信息检索及本体集成等方面的应用越来越广泛。2002年12月18日Berners-Lee在国际XML2000的会议提出Semantic Web(语义网)的构想[1]。在Semantic Web中,语义相似度算法是实现基于本体的检索、采集等的关键问题。因此语义相似度算法的好坏成为信息检索效率高低的重点,于是改良语义相似度算法是一个迫切的问题。关于语义的相关性,国内外专家已经做了大量的工作:Resnik根据两个词的公共祖先节点的最大信息量来衡量两个词的语义相似度。计算词语的语义相似度时,除了结点间的路径长度外,还考虑到概念层次树的深度、概念层次树的区域密度。鲁松研究了如何利用词语的相关性来计算词语的相似度。Li Sujian等提出了一种词语语义相似度的计算方法,计算过程综合利用了《知网》和《同义词词林》。朱礼军等引入了计算语言学中的语义距离思想来计算领域本体中概念间的相似度。本文总结前人的经验,并将概念的数据类型考虑其中,这样概念的语义相似度就更加精确。 2 本体与领域本体本体(Ontology)作为一种能在语义和知识层次上描述信息的概念模型,自被提出以来就引起了国外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和Web上异构信息的处理、语义Web等。 本体的概念目前对本体的定义有很多,专家们认为由Studer等人在1998年提出的“本体是共享概念模型的明确的形式化规范说明。[3]”最为精确。它包含4层含义:概念化(conceptualization)、明确(explicit)、形式化(formal)和共享(share)。(1)概念化:指通过抽象得出客观世界中一些现象(Phenomenon)的概念模型。(2)明确:指所使用的概念及使用这些概念的约束都有明确的定义。(3)形式化:指本体是计算机可读的(即能被计算机处理)。(4)共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。 本体的分类 Guarino[5]在1997年对本体依照领域依赖程度,分为顶级(top-level)、领域(domain)、任务(task)和应用(application) Ontologies共4类。其中: (1)顶级Ontologies描述的是最普通的概念及概念之间的关系,与具体的应用无关,其他种类的Ontologies都是该类Ontologies的特例。(2)领域Ontolo
gies描述的是特定领域中的概念及概念之间的关系。(3)任务Ontologies描述的是特定任务或行为中的概念及概念之间的关系。(4)应用Ontologies描述的是依赖于特定领域和任务概念及概念之间的关系。本文主要就是基于领域Ontology来设计与研究语义相似度计算方法。 3 语义相似度计算语义相似度是判断几个概念之间的语义的相似程度。在信息检索中,它反映的是用户查询关键词的意义上的符合

浅论一种医疗本体语义相似度算法的设计 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人cjc201601
  • 文件大小26 KB
  • 时间2018-08-13