外显子测序后如何筛新基因
时间: 2023-05-24 19:07:16 浏览: 191
一种结合单张芯片序列捕获和高通量测序技术测序 外显子组的方法
外显子测序可以帮助识别新基因。以下是基本步骤:
1. 将外显子序列比对到参考基因组。这可以用比对工具如Bowtie、BWA或STAR来完成。参考基因组可以是已知的基因组或者一个公共的参考序列数据库。
2. 过滤掉已注释的基因。这可以用已知基因注释文件,如GTF文件进行筛选。
3. 根据转录本进行聚类。得到聚类后,可以使用聚类工具如CD-HIT或USEARCH来删除冗余的序列。
4. 序列相似性检验。使用拟南芥或人类的编码蛋白质序列数据库来执行BLASTP或HMMER搜索,以便判断新外显子的编码蛋白质的相似性。
5. 序列结构的预测。使用软件包如Augustus、GeneMark等来预测新基因的外显子边界、起始位点等序列结构信息。
6. RNA-Seq数据的验证。使用RNA-Seq数据来验证相应的基因是否会表达,以及其转录水平和组织特异性。
7. 进行功能和进化分析。对于新基因的功能和进化可进行更为深入的研究,例如对编码蛋白质的结构和功能研究等。
阅读全文