R语言下载TCGA数据库乳腺癌数据
时间: 2023-05-28 15:01:39 浏览: 314
首先,你需要在你的电脑上安装 R 语言,可从以下链接下载并安装:https://cran.r-project.org/
然后,可以使用以下代码下载TCGA数据库乳腺癌数据:
```{r}
# 安装 TCGAbiolinks 包
install.packages("TCGAbiolinks")
# 加载 TCGAbiolinks 包
library(TCGAbiolinks)
# 设定你的TCGA访问令牌 (需先到TCGA官网申请令牌)
# enter your TCGA access token
my_token = Sys.getenv("TCGA_TOKEN")
# 设置你所关注的癌症类型以及数据分析类型 (具体分析类型请根据需要进行设置)
#设置数据分析类型如下:
# miRNASeq
# RNASeq (raw counts)
# RNASeq2 (normalized counts)
# RNASeqV2
# Methylation
# miRNAisoform
# RPPA
# CNV
# Mutation
# Mutation burden (UV Damage, smoking signatures…)
BRCA_data <- TCGAbiolinks::query_datas(gdcquery_cl = TCGAbiolinks::GDCquery(project = "TCGA-BRCA",
dataType = "RNASeq2",
file.type = "normalized_results",
access = "open",
legacy = TRUE),
requires = TCGAbiolinks::c("SummarizedExperiment"))
# 检查病人、基因数和样本数据:
dim(BRCA_data)
```
这样,你可以通过 `BRCA_data` 访问到下载的数据。注意,你需要使用你自己的 TCGA 访问令牌,且你需要先申请权限。
阅读全文