MEGA^件的使用
引言
现代分子生物学所积累的数据库(如美国国家生物信息中心建立的 GeneBank 等)隐含着大量的生物系统学和生物进化的有用信息。计算机软件是 挖掘这些知识宝藏的最有效的工具, 而且这些数据库不断快速扩展, 信息量十分 庞大。因此,如果没有计算机软件的帮助, 我们简直无法开战分子系统学和分子 进化方面的研究工作。同样,这些数据分析方法和软件在古 DNA 研究中是必不 可少的。
因为有着坚实的分子进化和人类遗传学基础, 序列比对分析已经成为重构物 种和基因家族进化历史, 估算分子进化速率、 推断基因和基因组进化过程中自然 选择力量的强度等的必不可少的方法和手段。 计算机的应用和统计学的介入大大 简化这些工作。在这些背景下, Sudhir Kumar 、Koichiro Tamura 和 Masatonshi Nei 和在上世纪九十年代初就发展了 Mega 遗传分析软件,并不断改进。现在公布了 版,增添很多新功能,并使软件使用者能在线取得帮助。
Mega ( Molecular Evolutionary Genetics Analysis )是一个界面友好、操作简 便、功能强大的分子进化遗传分析软件, 也是文献中经常用到的分析软件。 尤其 是,Mega的新版本对使用界面做了优化, 并有改进了许多统计学和遗传学算法,
其支持的文件格式很多,而且可以直接从测序图谱中读取序列。另外, Mega 软
件还内嵌了一个 Web浏览器,能直接登录 NCBI网站。
Mega 软件操作起来很方便,其界面与传统的 Windows 程序界面很像,即使 初学者也很易上手。
Mega 软件功能十分强大,尤其在计算遗传距离、 构建分子系统树方面。 Mega 软件提供多种计算距离的模型,包括 Jukes-Cantor 距离模型、 Kimura 距离模型、 Equal-input距离模型、Tamura距离模型、HEY距离模型、Tamura-Nei距离模型、 General reversible 距离模型、无限制距离模型等。 Mega 软件可以计算个体之间 的遗传距离,还可估算群体间的遗传差异, 及群体间的净遗传距离; 而其还可以 估算一个群体或整个样本的基因分歧度的大小。 另外 Mega 还提供了多种构建分 子系统树的方法,包括算术平均的不加权对群法 (UPGMA ,unweighted pair group method with arithmetic mean ),邻接法(NJ,Neighbor-Joining),最大简约法(MP, Maximum Parsimony )、最小进化法 (ME,Minimum Evolution )等。在此基础上, Mega 软件还提供了对已构建系统树的检验,包括自展法( Bootstrap Method )检 验和内部分支检验等。在对于自然选择方面, Mega 软件提供了 Codon-Based Z 检验、Codon-Based Fisher's原样检验t和Tajima中性检验三种方法。 总之,Mega 软件提供了构建分子系统树,进行系统发育分析各个方面的计算和分析。
本章将以古 DNA 数据分析为例,介绍 Mega 软件的基本原理和方法、使用 和操作、以及相关结果的分析。
Mega 软件包的下载网址为:
Mega软件输入数据的格式
Mega软件输入数据的格式比较简单,在众多遗传学分析软件中是比较容易 制作的一种。
首先,如果输入数据是一般的 DNA或RNA序列,则有如下要求:1)文件
扩展名以*.meg或*.txt结尾都行;2)输入数据文件,第一行必须有 Mega程序所 需的特殊标记“ #MEGA ”; 3) “TITLE ”位于输入文件的第二行,后边可以跟上 一些说明性字符,这些字符在输出结果中会显示出来。在与“ Title ”同一行上的
字符才有效,而且字符总数不能超过 128,超过的也会被忽略。4)在“#MEGA ' 和“ TITLE ”之后,在分析数据之前可以一行或多行的说明性文字。这些文字可 用来说明诸如作者、分析日期、分析目的等信息。 5)在每个数据(或每条序列)
的名字之前应该有一个 “#”,名字的下一行是具体的序列。 在同一个数据文件里,
不能出现数据名相同的序列。 在数据名及具体序列中, 空格和TAB是被忽略的。
6) 在同一数据文件内,所有序列的长度应该保持一致,否则,程序不能执行。
7) 对于 DNA或RNA序列,Mega软件能够识别 A、T、C、G、U五种字符, 缺失字符可以用“? ”表示,比对时的空缺位点可以用“一”表示。下边是一个
数据文件示例:
r IU^qida
mega使用手册 来自淘豆网m.daumloan.com转载请标明出处.