一种改进的基因功能相似度计算方法摘要:近年来,基于基因本体比较基因之间的功能相似度成为一个研究热点。当前,基因功能相似度计算方法可以分为2种类型:逐对(pair-wise)比较法和成组(group-wise)比较法。然而,由于基因本体注释数据的丰度问题,造成大量的基因具有相同的本体注释数据,从而导致基因功能相似度计算方法的结果存在偏差。本文提出一种改进的基因功能相似度计算方法,对注释集合的语义信息量进行归一化,达到准确度量基因之间的功能相似度的目的。实验结果表明:本文提出的方法可以消除相同注释对基因功能相似度计算方法的影响,且在测试平台上获得非常优秀的结果。本文采集自网络,本站发布的论文均是优质论文,供学习和研究使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息,如果需要分享,请保留本段说明。关键词:基因本体;基因功能相似度;相同注释;相似度归一化中图分类号: 文献标志码:A 文章编号:2095-2163(2017)05-0123-04 Abstract:,genefunctionalsimilaritycalculationmethodscanbemainlydividedintotwotypes:,duetotheabundanceofannotationdataofgenes,largenumberofgeneshastheidenticalontologyannotation,,andobtainaverygoodperformanceonthetestplatform. Keywords:GeneOntology;genefunctionalsimilarity;identicalannotation;similaritynormalization 0引言基因本体(GeneOntology,GO)联合会建立的数据库,其目标是能够满足跨数据库对基因和基因产物进行一致描述。GO是一个标准化、精确定义和控制(controlledvocabulary)的词汇库。当前,主要包括3个本体子结构:细胞成分()、分子功能(MolecularFunction,MF)和生物过程(BiologicalProcess,BP)[1]。3种子结构之间彼此是独立的,和MF三个方面对基因进行描述。在后基因组时代,基于基因本体比较和分析基因之间的功能相似性,具有重要的研究意义[2]。当前,基因功能相似度的计算方法已经在各种研究中得到广泛的应用,例如蛋白质相互作用预测[3-4]、蛋白质复合体识别[5-6]以及基因功能预测[7]、workprediction)[8]、疾病基因优先排序(diseasegeneprioritization)[9-10]等。基于基因本体和基因的功能注释数据,分析和比较基因之间的功能相似度,受到越来越多的关注。 1研究方法综述近年来,研究人员提出许多基于基因本体的?算基因功能相似性的方法[11-15]。整体上这些方法可以分为两大类:逐对(pair-wise)比较法和成组(group-wise)比较法[16]。前者重点关注术语对之间的关系,即首先计算术语对之间的语义相似度,然后整合术语对之间的语义相似度,从而得到基因之间的功能相似度;后者则从术语集合的角度出发,借助术语集合的语义相似度计算基因之间的功能相似度[17]。接下来将简单回顾这2种方法的研究发展历程。[BT5],整体上可以分为2步。第一步计算GO术语之间的语义相似性;第二步将术语之间的语义相似性整合,最终获得基因之间的功能相似性。计算术语之间语义相似性方法有3种类型:基于点(node-based)方法、基于边(ege-based)方法和混合(hybrid)法。Resnik[18]在计算2个术语的语义相似度时,
一种改进的基因功能相似度计算方法 来自淘豆网m.daumloan.com转载请标明出处.