序列分析一、碱基组成DNA序列一个显而易见的特征是四种碱基类型的分布。尽管四种碱基的频率相等时对数学模型的建立可能是方便的,但几乎所有的研究都证明碱基是以不同频率分布的。表1包含了9个完整DNA分子序列的资料,表2的数据来自两个胎儿球蛋白基因(Gr和Ar),每个基因具有三个外显子和两个内含子(shen等1981)。这两个例子说明序列内和序列间碱基具有不同的频率。在基因每一侧的500 个任意碱基区域被称为“侧翼”,基因间区域是指两个基因间的其余序列。表1 九种完整DNA序列的碱基组成表2 。碱基相邻的频率一般不等于单个碱基频率的乘积例:鸡血红蛋白β链的mRNA编码区的438个碱基图1 鸡β球蛋白基因编码区的DNA序列(GenBank:CHKHBBM,记录号J00860)表3 图1鸡β球蛋白基因序列的相邻碱基分布在编码区,存在某种约束来限制DNA序列编码氨基酸。在密码子水平上,这一约束与碱基相邻频率有关。表4列出了遗传密码和图1序列中各密码子数量。尽管数目很小,难以作出有力的统计结论,但编码同一氨基酸的不同密码子(同义密码子)好像不是等同存在的。这种密码子偏倚必定与两碱基相邻频率水平有关。表4还清楚地表明,由于密码子第3位置上碱基的改变常常不会改变氨基酸的类型,因而对第3位置上碱基的约束要比第 2位碱基小得多。表4 64种可能的碱基三联体密码子及相应的氨基酸数(据图1序列)
如何进行序列分析 来自淘豆网m.daumloan.com转载请标明出处.