ucsc 提取POLR2A和PIGR的mRNA序列和蛋白序列,提取POLR2A的第5个外显子序列和PIGR的第2个内含子序列,提取POLR2A和PIGR的5UTR序列。
时间: 2024-06-02 16:11:33 浏览: 99
提取基因序列文件
要提取特定基因的序列,首先需要确定该基因的基因名或基因ID。假设UCSC上已经有POLR2A和PIGR的注释信息,并且我们已经知道了它们的基因ID为"ENSG00000198901"和"ENSG00000175899"。
1. 提取POLR2A和PIGR的mRNA序列和蛋白序列
在UCSC浏览器中,选择"Genome Browser",选择对应的物种和基因组版本,然后输入基因ID。在基因注释信息中,可以看到基因的mRNA序列和蛋白序列。
对于POLR2A,mRNA序列为chr17:36,577,712-36,605,217,蛋白序列为NP_001073929.1。
对于PIGR,mRNA序列为chr1:243,847,005-243,866,262,蛋白序列为NP_002640.2。
2. 提取POLR2A的第5个外显子序列和PIGR的第2个内含子序列
在UCSC浏览器中,选择"Table Browser",选择对应的物种和基因组版本,然后输入基因ID。在"Group"栏中选择"Genes and Gene Predictions",在"Track"栏中选择"GENCODE Basic",在"Table"栏中选择"ensGene"。然后点击"Get Output"按钮。
在输出结果中,可以看到每个基因的基因结构信息,包括外显子和内含子的位置。对于POLR2A,第5个外显子的位置为chr17:36,588,300-36,588,934;对于PIGR,第2个内含子的位置为chr1:243,848,688-243,850,321。
根据这些信息,可以使用相应的软件或脚本从基因组序列中提取外显子或内含子序列。
3. 提取POLR2A和PIGR的5UTR序列
在UCSC浏览器中,选择"Table Browser",选择对应的物种和基因组版本,然后输入基因ID。在"Group"栏中选择"Genes and Gene Predictions",在"Track"栏中选择"GENCODE Basic",在"Table"栏中选择"ensGene"。然后点击"Get Output"按钮。
在输出结果中,可以看到每个基因的基因结构信息,包括UTR的位置。对于POLR2A,5'UTR的位置为chr17:36,605,218-36,607,832;对于PIGR,5'UTR的位置为chr1:243,866,263-243,869,274。
根据这些信息,可以使用相应的软件或脚本从基因组序列中提取5'UTR序列。
阅读全文