多重检验中的真实零假设比例估计:参数边缘模型方法

需积分: 0 0 下载量 121 浏览量 更新于2024-09-06 收藏 131KB PDF 举报
"吴小霞发表的‘Estimating the Proportion of True Null Hypotheses in Multiple Testing from a Parametric Marginal Model’论文" 这篇论文主要探讨了在多重假设检验(multiple testing)中如何通过参数边缘分布模型来估计真实零假设的比例。在现代科学实验分析中,尤其是在生物医学领域如基因微阵列实验中,常常需要同时测试大量的零假设。例如,可能需要对数千甚至上百万个基因的表达差异进行检验,每一个基因对应一个独立的零假设。这种情况下,多重检验问题变得至关重要,因为它涉及到控制假阳性发现率(False Discovery Rate, FDR)以及正确识别真正差异的基因。 论文提出的新方法基于有限混合对数似然函数,可以被视为经验贝叶斯方法的参数化版本。有限混合模型是一种统计工具,它假设数据是由多个不同成分的概率分布混合而成,这种方法在处理复杂分布或者难以建模的数据时特别有用。在多重检验的背景下,它能更灵活地捕捉不同假设下观察值的多样性。 经验贝叶斯方法通常用于在未知参数的情况下,通过对参数进行先验分布的假设来推断后验分布。参数化的版本则引入了一个明确的参数模型,使估计过程更加规范且可操作性更强。通过使用EM算法(期望最大化算法),论文中的方法能够估计出零假设的真实个数或者等价地说,它们所占的比例。 EM算法是一种迭代优化技术,常用于处理含有隐变量的概率模型。在这个上下文中,它被用来估计有限混合模型的参数,从而帮助区分哪些假设可能是真的,哪些可能是假的。通过模拟研究和真实数据案例,论文对比了新方法与其他现有方法的性能,以验证其在实际应用中的有效性和优势。 关键词涉及:EM算法、经验贝叶斯、有限混合模型、FDR(假阳性发现率)和多重检验。该论文的分类号O2121表明它属于统计学的范畴,具体是与统计推断和模型选择相关的部分。 这篇“Estimating the Proportion of True Null Hypotheses in Multiple Testing from a Parametric Marginal Model”提供了一种新的统计方法,用于在大规模假设检验中更准确地估计真实零假设的数量,这对生物信息学和其他多变量分析领域具有重要意义。