面向子空间的否定选择算法——提升高维检测性能

需积分: 0 0 下载量 92 浏览量 更新于2024-09-09 收藏 1.86MB PDF 举报
"这篇论文提出了一种面向子空间的否定选择算法(SONSA),旨在解决传统否定选择算法在高维空间中识别低维子空间样本效率低下的问题。通过在常规检测器训练基础上,寻找样本分布密度高的低维子空间,进一步训练面向子空间的检测器,从而提升对低维子空间内样本的检测性能。实验结果显示,与经典V-Detector算法和采用PCA降维的V-Detector算法相比,SONSA在保持相似误报率的情况下,能显著提高检测率,特别是在Haberman's Survival(三维)和Breast Cancer Wisconsin(九维)这两个标准数据集上表现突出。该研究受到国家自然科学基金的支持,由杨韬和邓红莉两位讲师进行,他们的主要研究方向分别是信息安全和机器智能。" 本文详细探讨了人工免疫系统中的否定选择算法在高维数据处理上的局限性,并提出了一种创新的解决方案——面向子空间的否定选择算法(Subspace-Oriented Negative Selection Algorithm, SONSA)。传统的否定选择算法在处理高维度数据时,往往对落入低维子空间的样本识别效果不佳,这限制了其在实际应用中的检测性能。为了解决这个问题,SONSA算法引入了一个新的策略,即在训练基础检测器后,通过搜索和识别样本分布密度高的低维子空间,来构建专门针对这些子空间的检测器。 在实施过程中,SONSA首先训练一个常规检测器,然后利用统计方法找出数据集中样本分布最密集的子空间。通过对这些子空间内的样本进行有针对性的训练,算法能够更有效地识别和处理这些区域的异常或目标。实验部分,论文对比了SONSA与经典的V-Detector算法以及应用主成分分析(PCA)进行降维后的V-Detector算法在Haberman's Survival(三维)和Breast Cancer Wisconsin(九维)两个数据集上的性能。结果显示,尽管误报率相近,但SONSA在检测率上表现出显著优势。 这一研究对于改进高维数据环境下的异常检测和分类任务具有重要意义,特别是在生物医学数据、图像识别和网络安全等领域。通过针对性地处理低维子空间,SONSA提供了一种有效提升检测准确性的新方法,为后续的高维数据处理研究提供了有价值的参考。