φ-混合删失模型:核密度估计的Berry-Esseen界分析

需积分: 10 1 下载量 30 浏览量 更新于2024-08-12 收藏 2.86MB PDF 举报
"φ-混合删失模型中核密度估计的Berry-Esseen界 (2014年)" 这篇论文主要探讨了在φ-混合删失模型下的核密度估计及其精度界限,即Berry-Esseen界。在统计学中,φ-混合序列是一种用于描述时间序列数据依赖性的模型,它能够更好地模拟实际数据中的复杂相依结构。在生存分析领域,研究对象通常是删失数据,即观测到的数据并非完整,例如,患者生存时间可能因为某些原因(如失去随访)而未被完全记录。 论文指出,生存时间X[1], X[2], ... 和删失时间Y[1], Y[2], ... 是两个独立的φ-混合序列,它们共同决定了观测到的删失数据Z[1], Z[2], ..., 其中Z[i] = min(X[i], Y[i])。删失机制是常见的右删失,即只有当生存时间小于或等于删失时间时,我们才能观察到生存时间。 在G已知的情况下,可以使用Kaplan-Meier估计来估算生存函数F。然而,当关注的是密度函数f时,论文引入了核密度估计方法。核密度估计是一种非参数方法,通过加权平均邻近数据点来估计未知密度函数。论文中给出的核密度估计公式包含了一个核函数K和一个窗宽h,窗宽h的选择对估计精度有显著影响,需要随着样本量n增加而逐渐减小。 论文的重点在于在φ-混合删失模型下,利用φ-混合序列的概率不等式和其他相关理论,推导出核密度估计的Berry-Esseen界。Berry-Esseen界是衡量统计估计与真实分布之间差距的一个标准,它给出了在中心极限定理框架下,统计量与正态分布之间的最大偏差度量。在随机删失数据的背景下,这个界对于理解核密度估计的精度和稳定性至关重要。 作者伍欣叶、吴群英和叶彩园通过这一研究,扩展了之前关于独立样本和删失独立样本的核密度估计工作,特别是考虑了数据的相依性。他们的结果对于处理具有相依结构的删失数据提供了理论依据,对于生存分析和时间序列建模等领域有重要的应用价值。此外,论文还引用了其他研究者的工作,如Breslow的Kaplan-Meier估计,王启华的Bootstrap方法,以及Fakoor和Lia吨等人在删失相依模型中的密度估计研究,显示出这一领域的研究深度和广度。