博弈论视角的序贯非参数检验方法

版权申诉
0 下载量 122 浏览量 更新于2024-07-06 收藏 5.28MB PDF 举报
"这篇文档是关于序贯非参数单样本和双样本检验的博弈论公式,作者是Shubhanshu Shekhar和Aaditya Ramdas,来自卡耐基梅隆大学的统计与数据科学及机器学习部门。文章探讨了在非参数背景下设计一致性的序贯单样本和双样本检验方法,主要采用测试如赌博的原理来构建这些测试。" 正文: 在统计学中,序贯检验是一种不断收集数据直至作出决策的统计分析方法,尤其适用于有限的样本资源或时间限制的情况。而非参数检验则不依赖于数据分布的具体形式,只基于数据的顺序关系或某些特征进行分析。本文档"Game-theoretic Formulations of Sequential Nonparametric One- and Two-Sample Tests"深入研究了如何在非参数环境中通过博弈论的视角设计这样的检验。 作者引入了“测试如赌博”的原则,将构建序贯测试的问题转化为选择能最大化虚拟赌徒财富的支付函数(payoff functions)的过程。在这个框架下,赌徒在一系列游戏中与零假设(null hypothesis)对赌。当赌徒的财富过程超过特定阈值时,测试会拒绝零假设。这种方法确保了以下两点: 1. 在零假设下,财富过程是一个非负鞅(martingale),从而可以严格控制第一类错误(type-I error),即假阳性率。非负鞅性质保证了在没有证据反对零假设的情况下,赌徒的财富不会无理由地增加。 2. 支付函数被设计为与一些统计距离度量的变分表示相关的见证函数(witness function)的可预测估计,例如积分概率度量(IPMs)和φ-散度。这些度量通常用于衡量两个概率分布之间的差异。通过这种方式,测试的敏感性得到保证,能够在数据中检测到与零假设相矛盾的显著差异。 IPMs和φ-散度是一类广义的距离度量,它们在机器学习和统计推断中有着广泛应用。IPMs衡量的是一个概率分布与另一分布集合之间的最大偏差,而φ-散度则包括了诸如Kullback-Leibler散度、Hellinger距离等经典度量。通过选择这些度量作为见证函数,序贯检验能够捕捉到不同分布间的细微差异。 总体来说,这篇文章提出的策略提供了一种创新的方法来构造非参数的序贯检验,它不仅保证了检验的统计功效,还通过博弈论的视角赋予了问题直观的解释。这种将统计决策与经济决策模型相结合的方法,可能为未来的研究开辟新的途径,特别是在处理复杂或未知分布的数据集时。