emapper.annotations文件:这是主要的输出文件,包含注释信息和注释统计数据。每行代表一个输入基因或蛋白质,列包括输入序列的ID、功能注释、COG注释、KOG注释、NOG注释、EC号、KEGG注释、KEGG Pathway注释等。
时间: 2023-07-10 07:30:25 浏览: 228
是的,您说得对。emapper.annotations是eggnog-mapper的主要输出文件之一,包含了输入序列的各种注释信息和统计数据。具体来说,每行代表一个输入基因或蛋白质,列包括以下内容:
1. **query_name**:输入序列的ID。
2. **seed_eggNOG_ortholog**:输入序列的Seed Ortholog的EGGNOG Ortholog Group ID。
3. **seed_ortholog_evalue**:输入序列和Seed Ortholog的比对E-value。
4. **seed_ortholog_score**:输入序列和Seed Ortholog的比对Bit-Score。
5. **Predicted_gene_name**:预测的基因名称。
6. **GO_terms**:Gene Ontology (GO) ID和term。
7. **KO**:KEGG Orthology (KO) ID。
8. **KEGG_Pathway**:预测的KEGG Pathway ID和描述。
9. **KEGG_Module**:预测的KEGG Module ID和描述。
10. **KEGG_Reaction**:预测的KEGG Reaction ID和描述。
11. **KEGG_rclass**:预测的KEGG Reaction Class。
12. **BRITE_hierarchy**:预测的BRITE hierarchy。
13. **COG**:Clusters of Orthologous Groups (COG) ID和描述。
14. **eggNOG_ortholog_groups**:输入序列的所有EGGNOG Ortholog Group ID。
15. **best_eggNOG_ortholog_evalue**:输入序列和最佳EGGNOG Ortholog的比对E-value。
16. **best_eggNOG_ortholog_score**:输入序列和最佳EGGNOG Ortholog的比对Bit-Score。
17. **Predicted_taxonomic_group**:预测的序列所属的分类群。
18. **Predicted_protein_name**:预测的蛋白质名称。
19. **COG_cat**:COG分类。
这些注释信息和统计数据可以用于进一步的生物信息学分析和可视化。
阅读全文