R语言在geo数据库提取的两列给定基因名转为ID
时间: 2023-11-30 18:03:20 浏览: 134
R语言实现遗传算法
5星 · 资源好评率100%
可以使用R语言中的biomaRt包来实现这个功能。首先,需要连接到Ensembl数据库,并选择所需的数据库和基因名。
下面是一段示例代码,假设我们要将基因列表中的基因名转换为Ensembl ID,其中基因列表已存储在一个名为`gene_list`的数据框中,包含两列,分别为`Gene_Name1`和`Gene_Name2`:
```R
library(biomaRt)
#连接到Ensembl数据库
ensembl <- useMart("ensembl")
#选择所需的数据库和基因名
dataset <- useDataset("hsapiens_gene_ensembl", mart = ensembl)
attributes <- c("ensembl_gene_id", "external_gene_name")
#提取基因ID
gene_id <- getBM(attributes = attributes,
filters = "external_gene_name",
values = gene_list$Gene_Name1,
mart = dataset)
```
这样,`gene_id`数据框将包含两列,分别为Ensembl ID和对应的基因名。同样的方法可以用于将`Gene_Name2`转换为ID。
阅读全文