1、生物学利用 MEGA5.0 和 Clustalx1.83 软件构建进化树MEGA 是一个关于序列分析以及比较统计的工具包,从 3.1 版本到后来的 4.0 版本一直都广为大家熟悉,现在推出了 Mega5.0 版本。功能比以前多有改进。现主要介绍使用Mega 5.0 构建系统进化树的方法。供大家参考。用 MEGA 构建进化树有以下步骤:1、测序:将克隆扩增测序得到的 16S rDNA 序列进行测序。2、NCBI 上做 Blasthttp:/www.ncbi.nlm.nih.gov/blast/Blast.cgi找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分
2、之百那基本可以确定你分离得到的就是 Blast 到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta 格式文件)下载下来,或点击 GenBank 登录号,复制 FSATA 格式,整合在一个*.txt 文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹) ,如XXXXAGGCTTAACACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGG
3、GATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGgi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequenceACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGGATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGC
4、CTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGA.参考序列选择注意事项:1、不选非培养(unclutured) 微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择 16S rDNA 全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。3、 使用 clustalx1.83 进行序列比对打开压缩文件 clustalx1.83,运行其中的 clustalx.exe 文件,如图:点击 File/load
5、 sequences,将整理好的*.txt 序列文件导入 clustalx1.83,如图接着点击 Alignment/Do Complete Aligment程序自动运行,得出结果,自动输出*.aln 和* .dnd 为后缀的两个文件,并自动存入你*.txt 文件所在的文件夹内。序列比对也可以直接用 MEGA 来做。4、运行程序 MEGA 5.0,如下图所示: 点击:File 导入 Clustal 程序得到的*.aln 文件。再点 File/Convert to MEGA Format,打开转换文件对话框,从目的文件夹中选中 Clustal 对比分析后所产生的*.aln 文件,转换为*.meg
6、 文件。转换时一路确认相关界面。最后查看 meg 序列文件最后是否正常,命名新文件存盘保存*.meg 文件,*.meg 文件会和 aln 文件保存在上述*.txt 同一个文件夹中。5、 关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的*.meg 文件。 如果为核酸序列,选择“Nucleotide sequence”,点击“OK”,得到以下图示。 选择默认的 Standard,点击 OK 后,如图所示。点击程序中的 ,可以得到下图在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标, 可对所选择的序列进行编辑,完成后点
7、击 close 即可。序列编辑完成后,可进行保存,点击保存后出现以下界面,点击 ok 即可。构建进化树的算法两类主要方法简要说明:独立元素法(discrete character methods)是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了) 。距离依靠法(distance methods)是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。
8、独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法( Maximum Likelihood methods) ;距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining) 。 (1) phylogenyUPGMA (2)用 Bootstrap 构建进化树,MEGA 的主要功能就是做 Bootstrap 验证的进化树分析,Bootstrap 验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。各种算法虽然不同,但是操作方法基本一致。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的
9、评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小, ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多(大于几千个碱基) ;用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完毕。 具体构建过程如下 参数的设置:点击 ,选择该菜单中的 Construct/test Nei
10、ghbor-Joining tree,选择前面转换得到的*meg 文件,得到下图点击 OK对下图的参数进行设置:说明:系统进化树的测试方法 Test of Phylogeny,通常要选择 Bootstrap method,也可以选择不进行测试;重复次数 No. of bootstrap Replications通常设定至少要大于 100 比较好,随机数种子可以自己随意设定,不会影响计算结果。一般选择 500 或 1000。Model/Method通常选择 Kimura 2-parameter。设定完成,点 compute,开始计算得到进化树构建的结果。如下图所示;该窗口中有两个属性页,一个是原
11、始树 Original tree,一个是 bootstrap 验证过的一致树 Bootstrap concensus tree。树枝上的数字表示 bootstrap 验证中该树枝可信度的百分比。得到构建的进化树后可以对该进化树进行优化。(本文参考网友的文章,同 Mega 的其它版本使用基本相同,在此表示感谢。以下进化树的优化部分直接引用)(1)利用该软件可得到不同树型,如下图所示: 除此之外,还可以有多种树型,根据需要来选择。 )显示建树的相关信息:点击图标 i。)点击优化图标,可进行各项优化: Tree 栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree。每种树都可以进行长度,宽度或角度等的设定 Branch:可对树枝上的信息进行修改。 Lable:可对树枝的名字进行修改。 Scale:标尺设置 Cutoff:cut off for consensus tree。一般为 50%。