多重假设检验中的估计问题与新方法

0 下载量 29 浏览量 更新于2024-09-05 收藏 178KB PDF 举报
"这篇论文是对多重假设检验问题中估计问题的深入分析,作者吴小霞和赵华玲探讨了在处理大量数据时如何控制假发现率(FDR)以降低错误率。文章提出了一种新的估计方法,并通过模拟实验展示了新方法的优越性。文章关键词包括多重检验、假发现率、BH法和EM算法。" 在统计学的假设检验中,单一假设检验的理论已经相当成熟。然而,随着科学技术的快速发展,大数据时代的到来使得多重假设检验成为了亟待解决的问题,尤其是在遗传学统计中。多重检验涉及到同时对多个假设进行检验,这需要一个有效的错误度量来控制第一类错误,即错误地拒绝了实际上为真的假设。 FDR(False Discovery Rate)是由Benjamini和Hochberg在1995年提出的,用来衡量在所有被拒绝的假设中,实际错误拒绝的比例。FDR的计算基于拒绝的假设中有多少是真正错误的估计。此外,还有类似的概念如pFDR(Positive False Discovery Rate),由Storey在2002年提出,它关注的是在所有被拒绝的假设中,实际上为假的比例。尽管两者有所区别,但它们之间存在关联,可以相互转换。 多重检验的一个关键挑战是如何在控制FDR或pFDR的同时,最大化检测到显著性假设的数量。传统的Bonferroni校正虽然严格控制了第一类错误,但可能导致检验过于保守,从而错过了重要的发现。因此,研究人员提出了各种策略,例如Benjamini-Hochberg(BH)方法,这是一种在不增加FDR的前提下提高检验灵敏度的方法。 在论文中,作者分析了在多重检验中使用FDR标准控制错误率时可能出现的估计问题,并提出了新的估计方法。这种方法旨在优化FDR控制,提高检测效率。通过模拟实验,新方法的表现优于现有方法,表明了其在处理多重检验问题时的优势。 论文的结构包括引言、FDR和pFDR的定义、多重检验的估计问题以及新方法的提出和验证。这部分内容详细阐述了新方法的工作原理和模拟实验的设计,以证明新方法在实际应用中的有效性。 这篇论文对于理解多重假设检验中的错误控制策略以及如何改进这些策略提供了有价值的见解。新提出的估计方法有望在处理大规模数据集的统计分析中发挥重要作用,尤其是在生物医学研究和其他领域,其中需要对大量变量进行同时检验。