edgeR：差异表达基因分析工具

需积分: 4 43 浏览量更新于2024-07-29 收藏 293KB PDF 举报

"edgeR是一个用于数字基因表达(Digital Gene Expression, DGE)数据分析的R包，主要用于差异表达基因分析，适用于芯片数据和RNAseq数据。它既可以处理多样本比较，也能进行单样本分析。这个软件工具的核心是基于精确检验的方法，以识别在不同条件或组别间表达水平显著变化的基因。" 在RNAseq分析中，edgeR提供了一个名为"DGEExact"的类，它是一个简单的基于列表的类，用于存储差异表达分析的结果。这个类包含以下几个关键部分： 1. **table**：这是一个数据框，包含了每个标签（通常是基因）的对数浓度（即表达水平），以及两组之间的对数fold change（表达量变化倍数）和差异表达的精确p值。 2. **comparison**：这是一个向量，指明了正在比较的两个实验组或条件。 3. **genes**：如果可用，这是一个数据框，包含关于每个转录本的附加信息。若无此类信息，则可能为空。此外，DGEExact类直接继承自R中的list类，因此所有适用于list的操作都可以应用于这个类的对象。它还具有一种show方法，用于显示对象的基本信息。除了DGEExact类，edgeR还提供了DGEGLM（Digital Gene Expression Generalized Linear Model）类，用于存储在DGE数据集上对每个标签或基因进行广义线性模型（GLM）拟合的结果。这允许用户利用更复杂的统计模型来分析基因表达数据，例如考虑额外的协变量或者非正态分布的误差结构。另一个相关的类是DGELRT（DGE likelihood ratio test），它可能包含了似然比检验的结果，这是一种比较不同模型（例如全模型与简化模型）对数据拟合程度的统计测试，常用于识别具有显著表达差异的基因。在使用edgeR时，通常会经过以下步骤： 1. **数据预处理**：包括读取数据、过滤低质量的reads、去除低表达的基因以及归一化等。 2. **建模**：根据实验设计构建合适的统计模型，例如使用glmFit函数。 3. **差异分析**：使用glmLRT或edgeR的topTags函数来识别差异表达的基因。 4. **结果解释**：查看基因的log-fold change、p值和调整后的p值（如FDR），并根据这些指标筛选出显著的基因。 5. **后分析**：可能包括富集分析、聚类分析或网络构建，以进一步理解差异表达基因的功能和相互作用。 edgeR是一个强大的工具，它提供了处理和分析高通量RNAseq数据所需的统计框架，帮助生物信息学家和研究人员在基因表达层面深入理解生物学过程的差异。通过精确的统计方法，edgeR能够可靠地检测到微小但有意义的基因表达变化，这对于疾病研究、药物发现以及对生物过程的理解都至关重要。

14 commonCondLogLikDerDelta

References

Anders, S, Huber, W (2010). Differential expression analysis for sequence count data Genome

Biology 11, R106.

Bullard JH, Purdom E, Hansen KD, Dudoit S. (2010) Evaluation of statistical methods for nor-

malization and differential expression in mRNA-Seq experiments. BMC Bioinformatics 11, 94. A

scaling normalization method for differential expression analysis of RNA-seq data.

Robinson MD, Oshlack A (2010). Genome Biology 11, R25.

Examples

d <- matrix( rpois(1000, lambda=5), nrow=200 )

f <- calcNormFactors(d)

commonCondLogLikDerDelta

Conditional Log-Likelihoods in Terms of Delta

Description

Common conditional log-likelihood parameterized in terms of delta (phi / (phi+1))

Usage

commonCondLogLikDerDelta(y, delta, der = 0, doSum = FALSE)

Arguments

y list with elements comprising the matrices of count data (or pseudocounts) for

the different groups

delta delta (phi / (phi+1)) parameter of negative binomial

der derivative, either 0 (the function), 1 (ﬁrst derivative) or 2 (second derivative)

doSum logical, whether to sum over samples or not (default FALSE

Details

The common conditional log-likelihood is constructed by summing over all of the individual tag

conditional log-likelihoods. The common conditional log-likelihood is taken as a function of the

dispersion parameter (phi), and here parameterized in terms of delta (phi / (phi+1)). The

value of delta that maximizes the common conditional log-likelihood is converted back to the phi

scale, and this value is the estimate of the common dispersion parameter used by all tags.

Value

numeric scalar of function/derivative evaluated at given delta

Author(s)

Davis McCarthy

剩余81页未读，继续阅读

aipeng520

粉丝: 2
资源: 1

edgeR：差异表达基因分析工具

edgebundle:R包实现边缘捆绑算法

GRFLeadingEdger_Pivot - MetaTrader 5脚本.zip

EDGER:创建用于测量恒星流出腔的半张角的算法

基于OpenCV的人脸识别小程序.zip

精选毕设项目-宅男社区.zip

精选毕设项目-扫描条形码.zip

配网两阶段鲁棒优化调度模型 关键词：两阶段鲁棒优化，CCG算法，储能 仿真算例采用33节点，采用matlab+yalmip+cplex编写，两阶段模型采用CCG算法求解 模型中一阶段变量主要包括01

comsol光栅仿真 计算复合波导光栅准BIC增强古斯汉森位移

精选毕设项目-车源宝寻车广场.zip

数字农业产业项目整体解决方案.pdf

最新资源

配网两阶段鲁棒优化调度模型关键词：两阶段鲁棒优化，CCG算法，储能仿真算例采用33节点，采用matlab+yalmip+cplex编写，两阶段模型采用CCG算法求解模型中一阶段变量主要包括01

comsol光栅仿真计算复合波导光栅准BIC增强古斯汉森位移