TCGAbiolinks包的用法
时间: 2023-07-29 17:08:11 浏览: 78
TCGAbiolinks是一个用于TCGA数据分析的R包,其官方网站为 https://bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html。以下是TCGAbiolinks包的用法:
1. 安装TCGAbiolinks包:
```
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("TCGAbiolinks")
```
2. 载入TCGAbiolinks包:
```
library(TCGAbiolinks)
```
3. 下载TCGA数据:
```
query <- GDCquery(project = "TCGA-BRCA", data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification", workflow.type = "HTSeq - FPKM")
GDCdownload(query)
```
这段代码将从GDC数据存储库中下载TCGA-BRCA项目的基因表达量数据,该数据集包括HTSeq - FPKM数据类型的转录组数据。
4. 标准化基因表达量数据:
```
data <- GDCprepare(query)
```
这段代码将标准化基因表达量数据并准备用于后续的分析。
5. 进行差异表达分析:
```
DE <- TCGAbiolinks::DEAnalysis(data, "BRCA", "ER+")
```
这段代码将对BRCA项目中ER阳性患者和ER阴性患者之间的基因表达差异进行分析,并返回一个包含差异表达基因的数据框。
6. 进行生存分析:
```
surv <- TCGAbiolinks::survivalAnalysis(DE, "BRCA", "ER+")
```
这段代码将对BRCA项目中ER阳性患者和ER阴性患者之间的生存差异进行分析,并返回一个包含生存曲线和统计信息的数据框。
希望这些用法可以帮助您使用TCGAbiolinks包进行TCGA数据分析。