递归核密度估计在核实数据中的应用与分析

需积分: 9 49 浏览量更新于2024-08-08 收藏 862KB PDF 举报

"递归核密度估计；渐近正态；核权函数" 本文主要探讨的是在处理替代数据（surrogate data）和核实数据（validation data）相结合的情况下的概率密度函数估计问题。递归核密度估计（Recursive Kernel Density Estimation, RKDE）是一种统计方法，用于估计总体分布的密度函数。这种方法在处理混合数据集时特别有用，因为它能够合并不同来源或类型的观测数据。在传统的核密度估计（Kernel Density Estimation, KDE）中，我们通常只使用单个数据集来估计未知的概率密度函数。然而，RKDE引入了一个递归过程，将替代数据和核实数据结合，从而提供更准确的估计。替代数据可以是原始数据的近似，而核实数据则是对真实情况的直接观察。通过这种方式，RKDE可以利用两种数据类型的不同信息，提高估计的精度。作者宇世航和赵世舜定义了一个递归型的核密度估计量，这个估计量不仅考虑了替代数据，还考虑了核实数据。他们证明了这个估计量在大样本情况下遵循渐近正态分布，这是统计学中一个重要的性质，意味着随着样本数量的增加，估计的精度会逐渐提高。在模拟研究中，他们发现当样本总数N保持不变，增加核实数据的样本容量n时，模拟效果会逐渐改善，特别是在数据分布的峰值部分。然而，对于分布的尾部，随着N的增加，模拟效果可能会变差。这表明在尾部区域，更多的核实数据可能比增加总体样本量更能改善估计。另一方面，如果同时增加N和n，模拟结果会更接近真实的概率密度函数f(x)，而且估计的光滑度也会提高。核权函数在KDE和RKDE中起着关键作用，它决定了密度估计的形状和精度。选择合适的核权函数对于得到良好的估计至关重要。不同的核权函数（如高斯核、Epanechnikov核等）会影响估计的局部偏差和全局形状。递归核密度估计提供了一种有效的方法来融合不同类型的数据，尤其适用于那些存在替代数据和核实数据的复杂情况。通过适当调整样本大小和核权函数，可以优化估计性能，更好地捕捉总体分布的特点。这项研究对于统计推断和数据分析领域具有重要的理论和实践意义，特别是在处理不完全或有噪声的数据时。

第  卷第  期吉林大学学报  理学版  ＶｏｌＮｏ

 年  月ＪｏｕｒｎａｌｏｆＪｉｌｉｎＵｎｉｖｅｒｓｉｔｙ ＳｃｉｅｎｃｅＥｄｉｔｉｏｎ Ｓｅｐ

核实数据下的递归核密度估计

宇世航



 赵世舜



齐齐哈尔大学理学院 黑龙江齐齐哈尔  吉林大学数学学院 长春 

摘要 基于替代与核实数据样本下的总体密度函数估计问题 定义一个递归型核密度的估计

量 它包含替代数据和核实数据两种信息 并证明了该估计量的渐近正态性模拟结果表明

给定样本总数Ｎ的情况下 模拟效果随核实数据样本容量ｎ的增加而渐好 当固定核实数据

样本容量ｎ时 顶部随样本总量Ｎ的增加模拟效果渐好 尾部变差 如果同时增大Ｎ和ｎ

模拟结果更趋近于ｆｘ 并且也更平滑

关键词 递归核密度估计 渐近正态 核权函数

中图分类号 Ｏ文献标志码 Ａ文章编号 

ＲｅｃｕｒｓｉｖｅＫｅｒｎｅｌＥｓｔｉｍａｔｉｏｎｏｆＰｒｏｂａｂｉｌｉｔｙＤｅｎｓｉｔｙ

ＦｕｎｃｔｉｏｎｗｉｔｈＶａｌｉｄａｔｉｏｎＤａｔａ

ＹＵＳｈｉｈａｎｇ



 ＺＨＡＯＳｈｉｓｈｕｎ



ＣｏｌｌｅｇｅｏｆＳｃｉｅｎｃｅ ＱｉｑｉｈａｒＵｎｉｖｅｒｓｉｔｙ Ｑｉｑｉｈａｒ  ＨｅｉｌｏｎｇｊｉａｎｇＰｒｏｖｉｎｃｅ Ｃｈｉｎａ

ＣｏｌｌｅｇｅｏｆＭａｔｈｅｍａｔｉｃｓ ＪｉｌｉｎＵｎｉｖｅｒｓｉｔｙ Ｃｈａｎｇｃｈｕｎ  Ｃｈｉｎａ

Ａｂｓｔｒａｃｔ Ｉｎｃｏｎｓｉｄｅｒａｔｉｏｎｏｆｔｈｅｐｒｏｂａｂｉｌｉｔｙｄｅｎｓｉｔｙｅｓｔｉｍａｔｉｏｎｐｒｏｂｌｅｍｗｉｔｈｓｕｒｒｏｇａｔｅａｎｄｖａｌｉｄａｔｉｏｎｄａｔａ ａ

ｒｅｃｕｒｓｉｖｅｋｅｒｎｅｌｅｓｔｉｍａｔｉｏｎｏｆｐｒｏｂａｂｉｌｉｔｙｄｅｎｓｉｔｙｆｕｎｃｔｉｏｎｉｓｓｏｄｅｆｉｎｅｄｔｏｃｏｍｐｒｉｓｅｂｏｔｈｓｕｒｒｏｇａｔｅａｎｄ

ｖａｌｉｄａｔｉｏｎｖａｒｉａｔｅｓｔｈａｔｔｈｅｐｒｏｐｏｓｅｄｅｓｔｉｍａｔｏｒｓａｒｅｐｒｏｖｅｄｔｏｂｅａｓｙｍｐｔｏｔｉｃａｌｌｙｎｏｒｍａｌＴｈｅｓｉｍｕｌａｔｉｏｎｒｅｓｕｌｔｓ

ｉｎｄｉｃａｔｅａｔａｇｉｖｅｎｃｏｎｓｔａｎｔｏｆＮ ｔｈｅｔｏｔａｌｎｕｍｂｅｒｏｆｄａｔａ ｔｈｅｍｅｔｈｏｄｐｅｒｆｏｒｍｓｂｅｔｔｅｒａｓｔｈｅｖａｌｉｄａｔｉｏｎｖａｒｉａｔｅ

ｎｉｎｃｒｅａｓｅｓＡｌｓｏ ｆｏｒａｇｉｖｅｎｎ ｓｉｍｕｌａｔｉｏｎｒｅｓｕｌｔｂｅｃｏｍｅｓｂｅｔｔｅｒｉｎｔｅｒｍｓｏｆｔｏｐａｓＮｉｎｃｒｅａｓｅｓ ｂｕｔｂｅｃｏｍｅｓ

ｂａｄｉｎｔｅｒｍｓｏｆｔａｉｌＷｅａｌｓｏｎｏｔｅｄｔｈａｔｔｈｅｓｉｍｕｌａｔｉｏｎｒｅｓｕｌｔ ａｓＮａｎｄｎｔｏｇｅｔｈｅｒｉｎｃｒｅａｓｅｓ ｍｏｒｅａｐｐｒｏａｃｈｅｓ

ｔｈｅｆｘ ａｎｄｉｓｓｍｏｏｔｈｉｎｇ

Ｋｅｙｗｏｒｄｓ ｒｅｃｕｒｓｉｖｅｋｅｒｎｅｌｅｓｔｉｍａｔｉｏｎ ａｓｙｍｐｔｏｔｉｃａｌｌｙｎｏｒｍａｌ ｋｅｒｎｅｌｆｕｎｃｔｉｏｎ

收稿日期 

作者简介 宇世航  女 汉族 硕士 副教授 从事非参数统计推断和时间序列分析的研究 Ｅｍａｉｌ ｑｑｈｒｙｓｈｃｏｍ

基金项目 国家自然科学基金 批准号   教育部人文社会科学研究一般项目 批准号 ＹＪＡＺＨ和黑龙江省教育厅

科研项目 批准号  

基于替代数据和核实样本推断的研究目前已有许多结果



Ｓｅｐａｎｓｋｉ等



研究了基于核实数据

的非线性ＥＶ模型 Ｗｏｌｖｒｅｔｏｎ等



提出了ｆｘ的递归型核密度估计

ｆ

ｎ

ｘ 



ｎ



ｎ

ｊ 



ｈ

ｊ

Ｋ

ｘ Ｘ

ｊ

ｈ

ｊ



由于递归型核密度估计在添加样本点时 不必重新计算所有项 只需计算添加项 因此使计算更方便

基于此 本文考虑借助于核实数据 构造一递归型概率密度估计量 并研究其渐近正态性

１主要结果

令完整数据集包括Ｎ个观测数据 假设其中有ｎ个独立同分布的核实观测数据Ｘ

ｉ



󲳏

Ｘ

ｉ



ｉＶ

和

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38747592

粉丝: 7
资源: 937

递归核密度估计在核实数据中的应用与分析

删失样本α混合序列递归核密度估计的逐点强相合性及速度 (2014年)

数据结构二叉树遍历递归，非递归

数据结构 递归和流 算法

数据结构 递归remove

mysql大数据量递归查询

数据结构递归与非递归

数据结构递归迷宫问题

怎么在Python中利用一组数据绘制递归图，并得到递归率这一参数

递归数据处理成非递归数据 java

数据结构递归算法应用

最新资源

数据结构递归和流算法

数据结构递归remove