文摘要���性J�菹嗨贫燃扑愕难芯坑胧迪�中的,有效的从元数据集中挖掘出相似元数据。通过此模块计算元数据间相似度,在满足了用户查询需求。�������甈��魑R恢中滦说脑J�莼ゲ僮餍�椋�J迪衷J�莸拇�播、共享和分发提供了解决办法。由于它的简单、低门槛、跨平台等优点,在众多领域中得到了应用。随着���橛τ玫牟欢侠┱梗�眯�橹性J�葑试闯氏殖隹焖�增长的态势,如何发现元数据间的关联,得到有用知识,以便用户从海量的元数据信息中获取所需、感兴趣的信息内容,成为目前迫切需要解决的问题。相似度计算作为发现信息关联,得到知识的基础,被广泛应用于信息检索、推荐和挖掘等领域,在信息处理中占据着重要的地位。本文在深入研究国内外相似度计算方法的基础上,结合元数据的结构特点,将相似度计算引入���橹校�栽J�菁涞南嗨菩越�卸攘浚�岢隽艘恢只�谙蛄靠�间模型的��甈�中元数据相似度计算方法。考虑到元数据不同元素位置的特征项对权重计算结果的影响,该方法在选择出元数据特征项后,采用位置权重系数改进的��甀�方法计算特征项权重,将元数据对象映射成空间中的向量,通过空间中向量夹角计算来度量元数据间相似度。本文设计和实现了��甈�服务提供者,并在其中集成了元数据相似度计算功能,将该功能作为服务提供者的一个模块,来组织服务提供者收集回来的元数据。实验分析表明,该方法对元数据相似度计算是可行用户查询浏览元数据时,自动推荐与所浏览元数据相似的资源,便于用户找到感兴趣的信息。这样不仅为用户提供了更好的增值服务、提高了信息服务质量,而且还关键词:��甈�;元数据相似度计算;向量空间模型;位置权重系数
甈���:�������.������瑆����甒�����,��甈���������甀����������:��������:�����������������,�����������.�������甈�,������,������瑂��������,�������.�����瓵�����,����.����.��
甌�����狿�,�������篛�—���籑����������籚�;���������������������,�.�����琱����.���
导师繇殛啉掣:生��储签名:冬�郝��嗍鲨�欤后颍骸焕�作者签名:叁王金率日期:娑互:兰:竖声关于学位论文使用权的说明明本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。本人完全了解太原科技大学有关保管、使用学位论文的规定,其中包括:.①学校有权保管、并向有关部门送交学位论文的原件、复印件与电子版;②学校可以采用影印、缩印或其它复制手段复制并保存学位论文;③学校可允许学位论文被查阅或借阅;④学校可以学术交流为目的,复制赠送和交换学位论文;⑤学校可以公布学位论文的全部或部分内容�C苎�宦畚脑诮饷芎笞袷卮斯娑�。尸
第一章绪论��研究背景是当前研究的主要课题。为元数据的共享和互操作提供了新的解决办法。该协议的最大优点是可以轻易发布用,越来越多的机构开始通过�⌒�槔捶⒉荚J�荩�沟梅�裉峁┱呤占�脑J��的组织,从而得到有用知识。针对相似度计算在信息处理中的重要作用,有必要对基于向量空间模型的相似度计算方法已被广泛的应用于相似度计算领域。它将文本简化为特征向量表示,把文本相似度计算问题简化为空间向量的运算,使得问题的复杂性大大降低;而且向量空间模型中可以使用不同的权重评价方法,使得模鉴于如上论述,本文结合���橹性J�莸慕峁固氐悖�岢隽艘恢只�谙蛄靠�为了满足人们对信息的需求,许多机构和单位建立了数字化服务平台。在这些平台中,数字资源有着不同的数据格式和表达方式,导致了描述和组织标准的差异,这就需要人们在不同的检索系统中输入不同的检索式,增加了检索的复杂性。因此,通过跨服务平台的信息资源互操作来实现资源共享,并为用户提供统一的资源检索���槭墙�改晏岢龅囊恢旨虻ァ⒘榛睢⒌兔偶鳌⒁资迪值脑J�莼ゲ僮餍�椋�多种不同格式元数据,具有良好的开放性和可扩展性。随着���榈姆⒄褂牍惴河�量急剧增加。同时,在服务提供者中�鏏���丫�7⒘诵矶嘁怨丶�首魑V�要匹配手段的元数据搜索引擎。但这些搜索引擎只是提供了简单的索引,没有对元数据进行深层次的挖掘。用户在信息检索时,往往会获得很多结果,其中很大一部分对于用户来说是无用或无关的,人们为了找到想要的结果,常常需要浏览查询几十条或几百条的元数据,造成用户浏览的烦琐和时间的浪费,带来了极大不便。面对海量的元数据信息,如何发现它们之间的关联得到有用知识,进而有效组织元数据,以
oai-pmh中元数据相似度计算研究和实现 来自淘豆网m.daumloan.com转载请标明出处.