局部加权Citation-kNN算法提升多示例学习性能

1 下载量 161 浏览量 更新于2024-08-27 收藏 843KB PDF 举报
本文主要探讨了"基于局部加权的Citation-kNN算法",这是一种针对多示例学习问题的改进版本,起源于传统的k-最近邻(kNN)算法。kNN算法在分类时依赖于样本间的距离度量,但在处理多示例问题时,由于其0-1决策策略的局限性,未能充分考虑样本的分布特性。Citation-kNN算法的出现旨在解决这一问题,它引入了局部加权的概念,通过综合考虑样本的分布情况,提出两种加权方法:样本距离加权和样本离散度加权。 样本距离加权方法根据每个样本与其邻居的距离赋予不同的权重,这样可以更精确地反映样本之间的相似性,尤其是在样本密集区域。另一方面,样本离散度加权则是通过衡量样本的离散程度,对那些在类边界附近或者稀疏区域的样本给予更大的影响,以增强模型的鲁棒性和适应性。 作者黄剑华、丁建睿、刘家锋和张英涛来自哈尔滨工业大学计算机科学与技术学院,他们在第35卷第3期的《电子与信息学报》上发表的研究论文中,详细描述了他们设计的局部加权Citation-kNN算法,并将其应用到标准数据集MUSK(多实例学习常用基准)和乳腺超声图像数据库上进行实验。实验结果显示,相较于原始的Citation-kNN算法,他们提出的这种方法在性能上有显著提升,具有更好的样本分布敏感性和适应性,特别是在处理复杂和非均匀分布的数据集时。 关键词包括:图像识别、多示例学习、Citation-kNN算法、样本分布和局部加权,这些都突出了论文的核心研究内容。此外,文章还提供了文献标识码(A)和文章编号,以及DOI(数字对象唯一标识符),以便读者追踪和引用。这项研究为多示例学习问题提供了一种改进的分类方法,有望在实际应用中提高模型的性能和泛化能力。