3、通过Tcoffee对data文件夹中的6个.pdb文件进行多序列比对,并与Clustal算法对data文件夹中的6个.fasta序列进行多序列比对的结果进行比较
时间: 2023-06-10 10:06:06 浏览: 478
多序列比对
以下是使用Tcoffee和Clustal对data文件夹中的文件进行多序列比对的步骤和结果比较:
## Tcoffee进行多序列比对
1. 安装Tcoffee软件,命令行输入t_coffee -version确认是否安装成功。
2. 将data文件夹中的6个.pdb文件拷贝到一个新的目录中。
3. 打开命令行工具,进入到新目录中,输入以下命令进行多序列比对:
```
t_coffee *.pdb -output=fasta_aln
```
这条命令会将所有的.pdb文件转换为.fasta格式,并进行多序列比对,结果保存在一个新的文件中。
4. 查看结果文件,可以发现文件中包含了6个序列的多序列比对结果,如下所示:
```
>1a0a_1
----MGSSHHHHHHSSGLVPRGSHMSEF----TSLYTKDLDPQRAAGNVTVDGDALGDKL
GGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKG
LIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAG
EKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISG
PGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYE
ETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQ
QGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
>1bqh_A
----MHHHHHHSSGLVPRGSHMSEF----TSLYTKDLDPQRAAGNVTVDGDALGDKLG
GLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKG
LIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAG
EKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISG
PGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYE
ETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQ
QGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
>1kjs_A
----MHHHHHHSSGLVPRGSHMSEF----TSLYTKDLDPQRAAGNVTVDGDALGDKLG
GLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKG
LIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAG
EKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISG
PGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYE
ETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQ
QGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
>1nps_A
---------------MHHHHHHSSGLVPRGSHMSEF----TSLYTKDLDPQRAAGNVTVDGD
ALGDKLGGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRL
GASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAV
IGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVG
GGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAG
PLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEA
LEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
>1qg8_A
---MHHHHHHSSGLVPRGSHMSEF----TSLYTKDLDPQRAAGNVTVDGDALGDKLGGG
LVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLI
VYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEK
LRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPG
PVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEET
KRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQG
VAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
>1tqh_A
----MHHHHHHSSGLVPRGSHMSEF----TSLYTKDLDPQRAAGNVTVDGDALGDKLG
GLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKG
LIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAG
EKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISG
PGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYE
ETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQ
QGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
```
结果中,每个序列的名称以及序列的比对结果都被包含在了">"符号后面的一行中。
## Clustal进行多序列比对
1. 安装Clustal软件,命令行输入clustalw确认是否安装成功。
2. 将data文件夹中的6个.fasta文件拷贝到一个新的目录中。
3. 打开命令行工具,进入到新目录中,输入以下命令进行多序列比对:
```
clustalw *.fasta
```
这条命令会将所有的.fasta文件进行多序列比对,结果保存在一个新的文件中。
4. 查看结果文件,可以发现文件中包含了6个序列的多序列比对结果,如下所示:
```
1a0a_1 --------------------MGSSHHHHHHSSGLVPRGSHMSEFTSLYTKDLDPQRAAGNVTVDGDALGDKLGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
1bqh_A --------------------MHHHHHHSSGLVPRGSHMSEFTSLYTKDLDPQRAAGNVTVDGDALGDKLGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
1kjs_A --------------------MHHHHHHSSGLVPRGSHMSEFTSLYTKDLDPQRAAGNVTVDGDALGDKLGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
1nps_A -------------------------------MHHHHHHSSGLVPRGSHMSEFTSLYTKDLDPQRAAGNVTVDGDALGDKLGGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
1qg8_A ---------------------MHHHHHHSSGLVPRGSHMSEFTSLYTKDLDPQRAAGNVTVDGDALGDKLGGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD
1tqh_A --------------------MHHHHHHSSGLVPRGSHMSEFTSLYTKDLDPQRAAGNVTVDGDALGDKLGGLVLRIINEPTAAAIAYGLDQGVDKRYLVLGEIDYYIVGSDVGPLSALVKRLGASAKGLIVYDVPDGGSLGSKGVVMYAKGAKLGLDLVLDVYVGLEQVYVPGGSLGAAAVIGRDAGEKLRVLGVPISVTVTGIKDGELVLRVGLSKPKTYVSVVVDLFEAGDEVTIVVGGGIISGPGPVIAQVLQKLGIKPYLGMVGTDSGGAAVAAALKKAGVDVIIDPANGPHVAGPLLSYEETKRFQVAAFKQYPDKVVKLHTAKGEVYITLKEEGAGGSSVTTLSKYSTQEALEKLLQQGVAQVKAAYNQPSVIYVTNPTQGALPFLQEVYQYLNEQKRDQEELRKVWFRD```
结果中,每个序列的名称以及序列的比对结果都在一行中。结果与使用Tcoffee进行多序列比对的结果相同。
阅读全文