biopython吧 关注:59贴子:174

快速ML建树fasttree

只看楼主收藏回复

FastTree是一款从成千上万条,甚至更多的蛋白质序列或者核苷酸序列中快速推断近似最大似然的系统发生树的软件,速度比较:


IP属地:广东1楼2017-02-24 22:52回复
    准确度:


    IP属地:广东2楼2017-02-24 22:53
    收起回复
      运行:
      FastTree <XXXXX.fasta> XXX.tree


      IP属地:广东3楼2017-02-24 22:57
      收起回复
        FastTree默认为GC+CAT模型, -wag 或 -lg 设置为 WAG+CAT 或 LG+CAT,-gtr设置为GTR+CAT:
        FastTree -gtr -nt < alignment.file > tree_file
        or
        FastTree -gtr -nt alignment_file > tree_file


        IP属地:广东4楼2017-02-24 23:10
        回复
          FastTree支持比对后的fasta格式或交叉的philip格式(interleaved phylip)


          IP属地:广东5楼2017-02-24 23:11
          回复
            fasta序列名如有空格,空格后名字被忽略,如:>Ecoli arcA protein被处理成>Ecoli
            如果想要完全的名字,需要加-quote参数


            IP属地:广东6楼2017-02-24 23:13
            收起回复
              Phylip interleaved格式序列名长度不限,序列名与序列之间要空格。
              必须是5000字符以内的序列块


              IP属地:广东7楼2017-02-24 23:18
              回复
                FastTree输出的是Newick格式的树,用MEGA、Archaeopteryx或者Arb查看。


                IP属地:广东8楼2017-02-24 23:20
                回复
                  -fastest 参数用来更快速度的构树(大概快两倍)


                  IP属地:广东9楼2017-02-24 23:29
                  收起回复
                    -gamma参数设置Gamma20模型(gamma model with 20 rate categories ),FastTree的Gamma20非常准确且比其他软件的Gamma4快大约100倍,但只降低自己大约5%的速度。


                    IP属地:广东10楼2017-02-24 23:46
                    回复
                      以PhyML的JTT+Gamma20为金标准,FastTree+CAT20、RAxML+Gamma4、FastTree+Gamma20的标准误差为19.0、17.3、7.0。


                      IP属地:广东11楼2017-02-24 23:53
                      收起回复
                        50 16S rRNA序列,以PhyML的JTT+Gamma20为金标准,RAxML+GTR+Gamma4、FastTree+GTR+Gamma20的标准误差为0.64和0.93


                        IP属地:广东12楼2017-02-24 23:57
                        回复
                          FastTree不建议利用CAT or Gamma20构建少于50条序列的比对序列,因为过少的序列对于每个位点的取样过少。


                          IP属地:广东13楼2017-02-25 00:10
                          回复
                            增加准确性:
                            -pseudo 序列不连续用这个参数
                            -spr 4增加minimum-evolution SPR moves
                            -mlacc 2 -slownni 增加ML NNIs(5,000 蛋白序列慢4x)
                            -no2nd用来增加-fastest参数的准确性


                            IP属地:广东14楼2017-02-25 00:20
                            回复
                              楼主 知道如何解决fasttree一按回车就闪退的问题吗


                              IP属地:浙江15楼2017-07-20 17:55
                              回复