基于本体的Web信息集成若干关键技术研究.pdf


文档分类:IT计算机 | 页数:约106页 举报非法文档有奖
1/106
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/106
文档列表 文档介绍
复旦大学
博士学位论文
基于本体的Web信息集成若干关键技术研究
姓名:张凯
申请学位级别:博士
专业:计算机软件与理论
指导教师:胡运发
20040420
摘要中提取概念的效率。该算法将我们在全文检索研究中的成果——互关联峁┝艘桓黾浞岣欢屑壑档男畔⒆试纯狻H绾未覹信息源中获取并提供给用户符合需要的畔⒄馐且桓鼍哂兄匾R庖宓睦砺酆褪导视τ课题。系氖菥哂邪虢峁剐浴⒁旃剐院头植夹缘忍氐悖庑┨氐憔龆本文在分析畔⑻氐愫偷鼻癢信息集成方法的基础上,以基于中间层本体的混合方法方法O咚鳎突诒咎宓腤信息集成若干关键技术进行了研究。这些研究包括了从对象集合中自动提取本体概念、面向表格的信息抽取、椒ㄖ兄屑洳惚咎宓墓乖臁⒈咎迳系娜嵝圆檠癕方法中的查询重写等内容,所做的工作和取得的创新成果主要体现在下面五个方岢隽艘桓龌诨ス亓:蠹淌髂P偷母拍罡窆乖焖惴ㄒ蕴岣叽佣韵蠹后继树模型应用于概念格构造当中,利用形式背景的互关联后继树模型,结合数据挖掘中对频繁项集的挖掘技术实现概念内涵的提取,在概念提取过程中避免了大量候选属性集的生成。与其它概念格构造算法相比,理论分析和实验都证明该算法具有一定的优越性。攵灾形男畔ⅲ岢隽艘桓龌谡虮泶锸健⒚嫦騑表格的信息抽取方法。该方法在分析表达概念的中文短语特点基础上,将表达同一本体概念的中文短语自动概括为一类正则表达式表示的方言模式,通过正则表达式的匹配实现从畔⒌奖咎甯拍畹挠成洌⑼闭攵訵表格特点,制定相应的策略解决匹配冲突。该方法重点解决了信息抽取中同一概念不同表达带来概念不易识别的问题,实验证明该方法具有一定杓枨蠊こ讨械亩嗍拥憷砺郏谝恍┫薅ê图偕瑁岢隽艘桓龌多视点的中间层本体构建方法,将各局部本体视为中间层本体的一个视点,根据构建过程中应遵循的三条原则,通过检查和处理各局部本体间的不一致性,使用启发式规则推理不同局部本体概念之间的关系等手段获取中间层本体。该方法在获取中间层本体的同时,也保证了中间层本嵝圆檠桶肴嵝圆檠拍钜氲奖咎宀檠敝校闭攵员咎逋嘉树的情况,提出了一个本体上半柔性查询的有效求解方法。该方法通过畔⒓墒且幌钍志哂刑粽叫缘墓ぷ鳌实用性。体与局部本体间的语义一致性。面:复亘大学博士学位论文第
关键词:本体,椒ǎ屑洳惚咎澹拍罡瘢嗍拥悖嵝圆檠建立索引和使用叶序区间判断肴嵝蕴跫是否满足实现本体上的半柔性查询求解。同传统的深度优先遍历方法相比,理论分析和实验都证明该求解方法具有一定优越性。菟芯康墓丶际鹾褪导氏钅恐械挠τ眯枨螅岢隽艘桓鍪褂肕方法的畔⒓商逑到峁梗⒒诟锰逑到峁箍7⒘艘桓龌诒咎的畔⒓稍拖低常迷拖低尘哂斜咎骞芾怼信息抽取、查询重写等功能,具有一定的实用价值。查询重写复旦大学博士学位论文第页摘要
%:鷗,,.,甀猙复旦大学博士学位论文第
,甒甒瑆,:,琺,....,,琿复量大学博士学位论文第页
第一章绪论弟一早三;百下匕研究背景本章首先阐述了本文的研究背景,重点讨论了基于本体的畔⒓芍械一些基本问题。然后回顾了这方面的相关研究工作。最后介绍了本文的研究内容与本文的结构安排。猿鱿忠岳矗丫⒄钩晌I弦诟鲇没В园偻蚋稣镜悖娲⒘耸个页面的巨大的全球化分布式信息空间。它的超文本形式包含了各种新闻报道、商业信息、技术资料、科研文献与文化娱乐等多种类与形式的信息集,为人们提供了一个极其丰富而有价值的信息资源库。对网络环境下的A啃畔⒔集成、分析处理并提供决策服务成为当前研究的新热点。系氖菥哂邪虢峁剐浴⒁旃剐院头植夹缘忍氐悖帘握庑┨匦裕S户提供统一的模式,是目前畔⒓傻墓丶侍狻D壳胺植际揭旃剐畔⒓成的方式主要有两种,结构化方法和面向语义的方法。结构化方法提供给用户供查询使用的统一结构模式,其主要特定是实现比较简单、信息源相对比较固定。结构化方法的一个代表性项目是笱Э7⒌腡系统【。因特网上数据所固有的异构性、分布性、增长性和变化性决定了结构方法不适应畔⒓桑⑶宜孀臰对拇罅ν乒悖嫦蛴义的畔⒓煞椒ㄒ殉晌猈信息集成技术的研究重点。每个镜阒械男畔⒋τ谀程囟ㄓ镆灞尘暗敝校飧霰尘爸械奶囟ㄖJ蕴涵在畔⒌敝校隬信息一起构成了畔⒌挠镆濉S捎赪信息的分布性,畔⒌挠镆蹇赡艽嬖谝旃刮侍猓斐捎镆逡旃怪饕S捎谙旅婕桓拍钤诓煌男畔⒃粗斜泶锊煌暮濉餍畔⒃词褂貌煌慕峁估幢硎鞠嗤或相似男畔ⅰ餍畔⒃粗械母拍钪浯嬖谧鸥髦至O担蛭8餍畔⒃吹姆植甲灾涡裕这种隐含的联系不能体现出来。在面向语义的畔⒓芍斜匦胩峁┮桓鐾ㄓ糜镆迥P鸵越饩鲇镆逡旃问题。这个通用语义模型是一个平台无关模型个问题:煌男畔⒃词褂枚嘀质跤词汇硎就桓拍睢复旦大学博士学位论文第
【恐薪壳盎诒咎宓男畔⒓煞椒ㄖ饕7治H郑旱ケ咎宸椒,屏蔽了畔⒅涞挠镆逡旃埂1咎魑!疤囟煊蚰诟拍以及概念之间关系的集合”『,能够有效地表达特定领域内的通用知识,非常适合作为面向语

基于本体的Web信息集成若干关键技术研究 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数106
  • 收藏数0 收藏
  • 顶次数0
  • 上传人779277932
  • 文件大小0 KB
  • 时间2011-06-08