生物信息学名词解释.docx失对序列相似性的影响,序列中的空位的引 : 是进化树中处于一组被分析物种
入不代表真正的进化事件,所以要对其进行 之外的,具有相近亲缘关系的物种。
: 研究大量生物数据复杂关系
罚分,空位罚分的多少直接影响对进化时间的系
用那些含量高的同功 tRNA 所对应的密码
较的序列。 P98
统树称为系统发育图,是引入时间概念的支
子,这种效应称为密码子偏好性。
( scoring matrix ): 在相似性检
序图。
索中对序列两两比对的质量评估方法。包括
基于理论(如考虑核酸和氨基酸之间的类似
: 指由于物种形成事件来自一个
共同祖先的不同物种中的同源序列,具有相
: 依据综合利用基因
的特征,如剪接位点,内含子与外显子边
界,调控区,预测基因组序列中包含的基 性)和实际进化距离(如 PAM )两类方法。
似或不同的功能。(书:在缺乏任何基因复
因。
P29
制证据的情况下,具有共同祖先和相同功能
( domain): 保守的结构单元,
(gap): 在序列比对时,由于序列长
的同源基因。)
包含独特的二级结构组合和疏水内核, 度不同,需要插入一个或几个位点以取得最
(并系)同源: 指同一个物种中具有
可能单独存在,也可能与其他结构域组
佳比对结果,这样在其中一序列上产生中断
共同祖先,通过基因重复产生的一组基因,
合。相同功能的同源结构域具有序列的
现象,这些中断的位点称为空位。 P29
这些基因在功能上可能发生了改变。 (书:
相似性。
:空位罚分是为了补偿插入和缺
由于基因重复事件产生的相似序列。 )
32. 超家族 :进化上相关,功能可能不同 且这些序列尚未集成到 SWISS-PROT 数据库
它位点为都是非简约性信息位点。
的一类蛋白质。 中。 1、生物信息学:生物分子信息的获取、存
( motif ): 短的保守的多肽段, (Molecular Modeling Database) :
贮、分析和利用;以数学为基础,应用计算
含有相同模体的蛋白质不一定是同源 是(NCBI)所开发的生物信息数据库集成系
机技术,研究生物学数据的科学。
的,一般 10-20 个残基。 统 Entrez 的一个部分,数据库的内容包括来 2、2、相似性(similarity ):两个序列 (核
34. 序列表谱( profile ):是一种特殊位 自于实验的生物大分子结构数据。与 PDB 相
酸、蛋白质)间的相关性。
点或模体序列,在多序列比较的基础 比,对于数据库中的每一个生物大分子结 3、3、同源性( homology):生物进化过程
上,氨基酸的权值和空位罚分的表格。 构,MMDB 具有许多附加的信息,如分子的
中源于同一祖先的分支之间的关系。
矩阵: PAM 指可接受突变百分 4、4、同一性( identity ):两个序列(核
生物学功能、产生功能的机制、分子的进化
率。一个氨基酸在进化中变成另一种氨 历史等 ,还提供生物大分子三维结构模型 酸、蛋白质)间未发生变异序列的关系。
基酸的可能性,通过这种可能性可以鉴 显示、结构分析和结构比较工具。 5、5、序列比对 (alignment ):为确定两个
定蛋白质之间的相似性,并产生蛋白质 数据库: 提供关于已知结构的蛋白
或多个序列之间的相似性以至于同源性,而
之间的比对。一个 PAM 单位是蛋白质序
质之间结构和进化关系的详细描述,包括蛋 将它们按照一定的规律排列。
列平均发生 1% 的替代量需要的进化时 白质结构数据库 PDB 中的所有条目。 SCOP 6、6、生物数据库检索 (database query ,
间。 数据库除了提供蛋白质结构和进化关系信息 数据库查询):对序列、结构以及各种二次
矩阵: 模块替代矩阵。矩阵中
外,对于每一个蛋白质还包括下述信息:到 数据库中的注释信息进行关键词匹配查找。
的每个位点的分值来自蛋白比对的局部块中 PDB 的连接,序列,参考文献,结构的图像 7、7、生物数据库搜索 (database search) :
的替代频率的观察。每个矩阵适合特定的进 等。可以按结构和进化关系对蛋白质分类, 通过特定序列相似性比对算法,找出核酸或
化距离。例如,在 BLOSUM62 矩阵中,比
分类结果是一个具有层次结构的树,其主要 蛋白质序列数据库中与待检序列具有一定程
对的分值来自不超过 62%一致率的一组序
生物信息学名词解释 来自淘豆网m.daumloan.com转载请标明出处.