第 12 卷第 21 期 2012 年 7 月科学技术与工程 Vol. 12 No. 21 Jul. 2012
1671—1815( 2012) 21-5328-04 Science Technology and Engineering 2012 Sci. Tech. Engrg.
基于本体的语义相似性研究
李文超杨妮妮
( 辽宁石油化工大学,抚顺 113001)
摘要为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似
性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,
提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实
验仿真计算验证了本体相似性算法的有效性。
关键词本体语义相似性煤炭矿井工程
中图法分类号 TP391. 3; 文献标志码 A
随着 Web 的快速发展,信息海洋不断扩张,传等科学领域中[1—3]。本体概念里有一层重要的含义
统的检索系统采用的是全文检索或主题匹配等检是知识共享,体现的是相关领域中公认的概念集,
索技术,不具备语义理解能力很难满足用户的需它所针对的是团体而不是个体,关注的是本体与本
要。例如,一个矿业工作者要检索与“数字测井”相体之间的关系,例如 part of( 整体与部分) 、kind of
关的数据时,如果单纯从字符串匹配的角度而不考( 包含) 、instance of( 实例) 和 attribute of( 实体与属
虑语义层次的检索,由于“JGS - 1B 智能工程测井性) 等关系。
系统”在字面上没有“数字测井”这几个字,虽然在本体之间的语义相似性程度是本体应用到各
[4]
语义上与“数字测井”密切相关,但这样的数据就很个领域的基础,可以实现某种程度的知识共享和
难被检索出来。因此,为了获取更符合用户预期的重用,以及提高系统通讯、互操作、可靠性的能力,
信息,研究特定领域知识体系所包含的概念及其之是构建具备语义理解能力的检索系统的基础。
。
间的语义联系成为解决这一问题的首要工作 2 本体的语义相似性
本文根据本体模型结构的特点,设计了本体语
义相似性和语义相关性算法,并以煤炭矿井的知识 2. 1 本体相似性概述
体系为实例,建立了相应的本体库,通过仿真计算, 本体相似性包括语义相似性和语义相关性两
验证了本体相似性算法的有效性。种。语义相似性指的是两个本体在某种场合下可
以相互替代,或者在语义上比较相近,例如“地震工
1 本体作者”和“地震专家”两个本体的含义就是一致的,
本体是为描述某个领域的知识库结构而组织当用户提交的检索与“地震工作者”相关的信息时,
“”
起来一系列术语,是知识共享的工具和载体。本体系统应该将与地震专家相关的页面一起返回给
。
的概念源于哲学领域,是表达概念语义的有力工用户
有时候,虽然两个本体本身没有什么相似之
具,后来逐渐被人们引入到情报科学、农业和地理
处,但是由于它们彼此之间有着千丝万缕的关系,
2012 年 3 月 6 日收到,4 月 26 日修改这种关系就是语义相关性。我们在研究语义相似
第一作者简
基于本体的语义相似性研究 来自淘豆网m.daumloan.com转载请标明出处.