生物信息学:人工模板选择与常用软件工具详解

需积分: 33 46 下载量 32 浏览量 更新于2024-08-08 收藏 6.26MB PDF 举报
《加强人工模板选择-i.mx_virtualization_user's_guide》是一份针对生物信息学领域中人工干预模板选择的指南,特别关注在 PROSPECT 预测结果置信度较低(z-score < 8)的情况下,如何通过系统化的方法确保结果的准确性。这个过程强调了对原始序列的深入分析和数据库检索的重要性。 首先,当使用 PROSPECT 进行预测时,如果得到的置信度不足,会涉及到对蛋白质序列进行人工评估。在这个阶段,不仅依赖于预测流程的结果,还需要综合考虑所选模板的结构功能信息。数据库检索是关键步骤,比如利用 SWISSPROT 数据库,这是目前最全面的蛋白质序列数据库。SWISSPROT 的特点是所有序列都经过专家验证,包含详细信息如结构域、功能位点、跨膜区域、翻译后修饰和突变体等。 在实际操作中,首先通过 PSI-BLAST 在 SWISSPROT 中搜索功能相似的序列,并按 E-value 排序。对于找到的酶类蛋白,还会记录其国际编号(EC 编号),因为酶的分类和功能对于后续分析至关重要。 此外,该指南还提到了生物信息学实用技术系列中关于数据处理和分析的部分内容。例如,章节涵盖了Unix/Linux操作系统的基础操作,如远程登陆、文件管理、文本处理、权限设置、备份与压缩,以及软件安装等。在数据处理方面,涉及测序原理、峰图转化、序列分析工具(如Phrap、Cap3、Consed、Primer3等)、全球和局部序列比对(Clustalw、MUSCLE、HMMER、BLAST等)、基因组/基因注释(如重复序列检测、RNA分析、基因预测和功能注释,如InterproScan和WEGO)、SNP分析(如Polyphred、SNPdetector和cross_match)以及进化分析工具(如Phylip、PAML等)。 通过这些技术,用户可以掌握一套完整的生物信息学工作流程,确保在面对低置信度预测时能够准确选择和利用模板,从而提升研究的科学价值。这份指南对于生物信息学家、分子生物学家以及从事相关领域的研究人员来说,提供了宝贵的技术指导。