进化树构建-NJ法(mega)
进化树构建-NJ法 V1.2
By ZHAO Yangguo, email: [email protected]
通过长期的分析认为对于16S rDNA序列的进化(Phyligenetic tree)树建,采用NJ(Neighbor-joining)法更准确,而且相比其它方法速度较快。
在以前版本介绍中,我们以phylip中的软件包为例说明构建进化树的基本过程及评价方法,但由于方法较为复杂,应用受到很大限制。基于Mega 4.0(free of charge, )刚刚发布,我们将以此软件为工具进行系统发育树的构建分析,希望给广大初学者以帮助。
软件包下载网址:
Mega 4.0
Treeview:
1 序列的整理及相似序列的获得
将已测得的16S rDNA序列去掉载体序列后,全部改成fasta格式,并放到一个.txt文件中。如下所示:
―――――――――――――――――――――――――――――
>Eu-b1
AGAGTTTGATCCTGGCTCAgGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACgCGAAAGGGACTTCGGTCCTGAGTAAAGTGGCGCACGGGTGAGTAACGCGTAGATAACCTGTCTTTGTGTCTGGAATAATACTTCGAAAGGGGTACTAATACCGGATAACCTTGCTTTTCACAAGTTATGCAAGCAAAGGTGGCCTCTGATACAAGCTACTGCATGAAGAGGGGTCTGCGTACCATTAGCTAGTAGGTGGGGTAATGGCCTACCTAGGCGACGATGGTTAGCGGGTCTGAGAGGATGATCCGCCACACTGGCACTGGAACACGGGCCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGCGCAATGGGGGCAACCCTGACGCAGCGACGCCGCGTGAGTGAGGAAGGCCTTCGGGTCGTAAAGCTCTGTCAAGAGGAAAGAAGTGCATAATGGTTAATACCTGTTATGTTTGACGGTACCTCTAAAGGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAA
>Eu-b2
AGAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAGAAGAGCTTGCTCTTCGATTCAGCGGCGGACGGGTGAGTAATACCTAGGAATCTGCCTGGTAGTGGGGGACAACGTTTCGAAAGGAACGCTAA
TACCGCATACGTCCTACGGGAGAAAGCAGGGGACCTTCGGGCCTTGCGCTATC
AGATGAGCCTAGGTCGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCTACGATCCGTAACTGGTCTGAGAGGATGATCAGTCACATTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAA
GCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCATTAACCTAATACGTTAGTGTTTTGACGTTACCGACAGAATAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAA
――――――――――――――――――――――――――――――――――――
通过Genbank(http://www.ncbi.nlm.nih.gov/blast/)中的Blastn检测最相似序列或在GenBank中下载参考序列,选择。将上述序列粘贴到输入框中,如下图:
点击Blast,得到如下结果:
根据序列相似性大小,将相似性最大的序列下载下来:点击每个序列前方的连接,下载: 选择fasta格式,并下载下来,与原始文件放在一起形成一个文件,同时加上参考序列,在此我们加上大肠杆菌序列:
>Eu-b1
AGAGTTTGATCCTGGCTCAgGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACgCGAAAGGGACTTCGGTCCTGAGTAAAGTGGCGCACGGGTGAGTAACGCGTAGATAACCTGTCTTTGTGTCTGGAATAATACTTCGAAAGGGGTACTAATACCGGATAACCTTGCTTTTCACAAGTTATGCAAGCAAAGGTGGCCTCTGATACAAGCTACTGCATGAAGAGGGGTCTGCGTACCATTAGCTAGTAGGTGGGGTAATGGCCTACCTAGGCGACGATGGTTAGCGGGTCTGAGAGGATGATCCGCCACACTGGCACTGGAACACGGGCCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGCGCAATGGGGGCAACCCTGACGCAGCGACGCCGCGTGAGTGAGGAAGGCCTTCGGGTCGTAAAGCTCTGTCAAGAGGAAAGAAGTGCATAATGGTTAATACCTGTTATGTTTGACGGTACCTCTAAAGGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAA
>gi|45238864|gb|AY548775.1| Desulfobulbus sp. RPf35L17 16S ribosomal RNA gene gene, partial sequence
TTGATCCTGGCTCAGAACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGCGAAAGGGACTTCGGTCCTGAGTAAAGTGGCGCACGGGTGAGTAACGCGTAGATAACCTGTCTTCATGTCTGGAATAATACGCCGAAAGGGGTACTAATACCGGATATTCTTGCTTTTCATAAGTTATGCAAGCAAAGGTGGCCTCTGCATATGCTACTGCATGAAGAGGGGTCTGCGTACCATTAGCTAGTAGGTGGGGTAATGGCCTACCTAGGCGACGATGGTTAGCGGGTCTGAGAGGATGATCCGCCACACTGGCACTGGAACACGGGCCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGCGCAATGGGGGAAACCCTGACGCAGCGACGCCGCGTGAGTGAGGAAGGCCTTCGGGTCGTAAAGCTCTGTCAAGAGGAAAGAAGTGTACAATGGCTAATACCTGTTGTATTTGACGGTACCTCTAAAGGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTGTTCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGCTTGGTAAGTCAGATGTGAAAGCCCACGGCTTAACTGTGGAAGTGCATTTGAAACTGTCAGGCTTGAGTACCAGAGGGGAAAGTGGAATTCCCGGTGTAGAGGTGAAATTCGTAGATATCGGGAGGAATACCGGTGGCGAAGGCGACTTTCTGGCTGGATACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGTGAACTAGATGCAGGGGGTGTTGATCCCTTCTGTGTCGCAGCTAACGCATTAAGTTCACCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCCGGAAATCTTTTGGAAACAAGAGAGTGCTTCCATTCGGAAGAATCTGGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGCCTTTAGTTGCCAGCAGTTCGGCTGGGCACTCTAAAGGGACTGCCGGTGTTAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCTTTATGACCAGGGCTACACACGTACTACAATGGCCGATACAAAGGGCAGCGACACTGCGAGGTGGAGCCAATCCCATAAAATCGGTCTCAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGGGAGTCGGTTGTACCAGAAGCAGTTGAGCTAACCGCAAGGGGGCAGGCTGCCAAGGTATGGCTGGTAACTGGGGTGAAGTCGTAACAAGGTAACCGTA
>Eu-b2
AGAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAGAAGAGCTTGCTCTTCGATTCAGCGGCGGACGGGTGAGTAATACCTAGGAATCTGCCTGGTAGTGGGGGACAACGTTTCGAAAGGAACGCTAATACCGCATACGTCCTACGGGAGAAAGCAGGGGACCTTCGGGCCTTGCGCTATCAGATGAGCCTAGGTCGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCTACGATCCGTAACTGGTCTGAGAGGATGATCAGTCACATTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCATTAACCTAATACGTTAGTGTTTTGACGTTACCGACAGAATAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAA
>gi|62465604|gb|AY972175.1| Pseudomonas putida strain P19 16S ribosomal RNA gene, partial sequence
CCTGTTTTGCATGCCGTCCCAAGCGGTCACTTAATGCGTTAGCTGCGCCACTAAAATCTCAAGGATTCCAACGGCTAGTTGACATCGTTTACGGCGTGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACGCTTTCGCACCTCAGTGTCAGTATCAGTCCAGGTGGTCGCCTTCGCCACTGGTGTTCCTTCCTATATCTACGCATTTCACCGCTACACAGGAAATTCCACCACCCTCTACCGTACTCTAGCTTGCCAGTTTTGGATGCAGTTCCCAGGTTGAGCCCGGGGCTTTCACATCCAACTTAACAAACCACCTACGCGCGCTTTACGCCCAGTAATTCCGATTAACGCTTGCACCCTCTGTATTACCGCGGCTGCTGGCACAGAGTTAGCCGGTGCTTATTCTGTCGGTAACGTCAAAACACTAACGTATTAGGTTAATGCCCTTCCTCCCAACTTAAAGTGCTTTACAATCCGAAGACCTTCTTCACACACGCGGCATGGCTGGATCAGGCTTTCGCCCATTGTCCAATATTCCCCACTGCTGCCTCCCGTAGGAGTCTGGACCGTGTCTCAGTTCCAGTGTGACTGATCATCCTCTCAGACCAGTTACGGATCGTCGCCTTGGTGAGCCATTACCTCACCAACTAGCTAATCCGACCTAGGCTCATCTGATAGCGCAAGGCCCGAAGGTCCCCTGCTTTCTCCCGTAGGACGTATGCGGTATTAGCGTTCCTTTCGAAACGTTGTCCCCCACTACCAGGCAGATTCCTAGGCATTACTCACCCGTCCGCCGCTGAATCGAAGAGCAAGCTCTTCTCATCCGCTCGACTTGCATGTGTTAGGCCTGCCGCCAGCGTTCAATCTGAGCCAGGATCAAACTCTGTTGCTAAAAAAAATTCCCGGA
>E.coli-M25588, 参考序列
AAATTGAGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGCAGAAGGGCTTGCTGCTTTTGACGCTGGACGGCGAGTGTGTAATGTCTGGGAAACTGCCTGGGGGGAGATGATAACACTTGGAAACGGTAGCTAATACGTGCATAATGTCGCAAGACCGAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGCCCAGATGGGATTAGGGGTAGCTAGTAACGAGTGGCTCACCTAGGCGACGATTCCAGCTGGTCTGAGAGGGATGACCAGCACCACTGGAACTGAGACACGGTCCAGACTCCTACGGGGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGTGCCGTATGAAGGAAGCCTTCGGGTTGTGAAGGGAGTAAAGTCTAATACTTTGCTCATTGTTACCCGACGCAGCGAAGAAGCCACGTACTTTCAGCGAGAGAAGGGGGGGTGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGAGGTTAATCGCAAGCGTGGGCGGAATTACTGTAAAGCACGAGCGCCTGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCCTAACCCTGGGAACTGCATCTGATACTGGCAAGCTTGTAGGTCTCGGAGAGGTAGAATTCCAGTAGAGATCTGGGGAATACCGGTGGCGGAAGCCCCCCTGGCGGACTGACGAAAGCTCAGGTGTGCGGGGGCATACTCCGCCGGTAGTCCACGTAAACGATGTCGTGGGGTGACTTGCCCCTTGAGGCGTGGCCTTCGAGGCGCTAACGTTAAGTCGCCTGACCCGGGGGGGTACGCCGCAAGGTTAAAACTCAAATCGAATTGGGGGCCCGGAGCACAAGACGCATGATGTGCGTTTAATTCGCAACGAAGAACCTTACCTGGTCTTGACCATCACGGAAGTGTTTTCAGAGATGAGAATGTGCTTCCGGGAACCGAGACAGCTGCATGGCTGTCAGGTCGTGTTGTGTTGCGAAATGGGTCCCGTTAAGTTGCCTGC
AACGAGCAACCCTTATCCTTTGTTGCCAGCGGGAACTCAAAGAGAGACTGCCAGCCGTCCGTGGATTAAACGAGGGGGGGAAGTGGGGATGACGTCAAGTCATCATGGCCCCCTTCACGACCAGGGCACACACTGTGCTACAATGGCGCATCACAAAGAGAGCGACTCCCGCGAGAGCAAGCGGATCTCATAAAGTCGTGCGTAGTCTGAGGTCCGGATTGCTAACCGACTCCATGAAGTCGGAATCGCTAGTGTAATCGGATCCAGAATGCACCGGTGAATACGTTCCCGGGCCTTGTACACACGCCCCGTCACACCATGGGGTGGAGGTGACTGTGGGTTGATATTCGTCCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCTTACCACTTTGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTGGATCACCTCCTTA
2 进化树构建及评价
打开软件
Mega 4.0,如下图所示:
首先必须对获得的序列进行对齐,该软件集成了Clustal W,所以可直接通过Mega 4.0进行序列的对齐。
选择AlignmentÆAlignment Explorer/CLUSTAL, 将刚才获得的Fasta格式的序列,直接粘贴进去(Crl+C, Ctrl+V),或将获得的序列存在文本文件中后(扩展名为*.fas),打开。如下
图所示。
序列文件打开后,结果如下图:
直接选择Alignment/Aign by Clustal W,如下图所示:
对齐结果如下图所示:
通过点击序列上方空格,以及与shift键的综合使用,去掉两端不齐序列,保存成*.mes 和 *.meg文件,如sequence.meg。
回到mega 4.0初始界面,将刚才保存的sequence.meg打开,如下图所示。
在主程序中,选择Phylogeny/Bootstrap Test of Phylogeny/Neighbor-Joining;当然也可以直接采用Phylogeny/Construct Phylogeny/Neighbor-Joining(不带Bootsrap评价),如下图所示。
根据要求,可以更改Bootstrap重复次数,以及其它参数。这里,我们将其改为1000次。
点击:Compute
,很快树就出来的,而且还带有必需的支持率,可以改变树的不同显示方式。
100620.80.70.60.
50.40.30.20.10.0
由于进化树图谱的分辨率较低,而且,部分内容还需修改,所以建议采用拷贝的方式,通过photoshop增加分辨率及丰富其内容.
我们将通过该软件绘制的进化树,同以前Phylip软件包绘制的进化树进行对比,基本没有太大变化(无根树是一致的,外族选择不同,导致其它变化),而且树形更加美观. 下图是采用Phylip绘制的进化树,参见之前版本。
当然,进化树构建软件越来越多,应该选择知名度高,被广泛接受的软件进行画图,这样才容易被人认可。