Bootstrap算法在可拓模式识别经典域确定中的应用

需积分: 9 1 下载量 93 浏览量 更新于2024-08-11 收藏 666KB PDF 举报
"这篇文章是2015年发表在海军航空工程学院学报上的一篇工程技术领域的论文,作者包括张金春、张家宾、李超亚和王帅磊。文章探讨了在可拓模式识别算法中如何更精确地确定经典域区间,针对小样本、数据不完全和分布未知等问题,提出采用Bootstrap算法作为改进方法。" 正文: 可拓模式识别算法是一种基于可拓学理论的模式识别技术,它通过对不同关联度的比较来识别样本所属的模式。在这个过程中,经典域的确定至关重要,因为它直接影响到识别的准确性和效率。传统的经典域确定方法主要依赖于数理统计学,比如通过抽样和假设检验来确定统计分布,并据此设定经典域。然而,这种方法对于小样本数据、不完整数据集以及数据分布未知的复杂情况往往不适用。 Bootstrap算法是一种统计抽样方法,它通过从原始数据集中多次重抽样(有放回抽样)来创建多个“bootstrap样本”,然后基于这些样本的统计特性来估计总体参数。在可拓模式识别中,Bootstrap算法可以用来更精确地估计经典域区间,因为它能处理样本量较小、数据不完整和非正态分布的数据,从而提供更稳健的统计估计。 传统的数理统计方法在处理非正态分布数据时可能产生偏差,特别是在数据具有偏斜性或者存在异常值的情况下。Bootstrap算法的优势在于其不需要严格的正态性假设,能适应各种数据分布,因此在确定经典域时更为灵活和准确。 在构建可拓模式识别的物元模型时,经典域的确定是一个关键步骤。物元M由对象O、特征C和与特征相对应的取值范围V组成。在模式识别中,每种模式对应特征的取值范围构成了该模式的经典域。例如,第j类模式有n个特征,每个特征的取值范围为Vjn=(ajn, bjn),那么模式j的经典域物元可以表示为Mj=(O,C,Vjn)。 文章指出,考虑到现代数据的特点,如不完整性、大规模样本和异常值,传统的统计方法已经不能满足实际需求。因此,引入Bootstrap算法作为经典域确定的新方法,对于提高可拓模式识别算法的性能具有重要意义。通过对比Bootstrap算法和传统方法的结果,可以更深入地理解数据的特性和模式识别的准确度,这对于优化算法和提升模式识别领域的研究水平具有积极的影响。