HBILS-SVM:一种快速近似的LS-SVM算法

需积分: 8 0 下载量 174 浏览量 更新于2024-08-12 收藏 452KB PDF 举报
"这篇论文是2010年发表在《上海师范大学学报(自然科学版)》第39卷第5期的一篇自然科学论文,主要探讨了最小二乘支持向量机(Least Squares Support Vector Machine, LS-SVM)的一个快速近似算法,即HBILS-SVM算法。该算法旨在解决LS-SVM在处理大规模数据集时的计算复杂性和非稀疏性问题。" LS-SVM是一种广泛应用的分类方法,源于Vapnik的统计学习理论,它通过求解二次规划问题找到最优分类边界。然而,随着样本数量的增加,传统的SVM方法的计算复杂度会显著上升,限制了其在大数据集上的应用。为了应对这个问题,研究人员提出了多种改进算法,如SVM-light和RSVM等。 LS-SVM由Schoelkopf等人提出,它通过最小化训练样本的误差平方和来构建分类模型,相比于原始SVM,LS-SVM通常可以提供更简洁的解析解。但其不足之处在于解不具有稀疏性,即支持向量的数量可能过多,导致模型复杂度高,不适合处理大数据集。 为了解决这个问题,论文提出了HBILS-SVM算法。这个算法结合了Backfitting和Invfitting规则,通过迭代的方式增加或减少支持向量,直到满足预设的停止条件。这种方法降低了计算复杂度,使得得到的解更加稀疏,并且支持向量具有更好的全局最优性。与现有的稀疏化算法相比,HBILS-SVM在保持相同泛化性能的同时,能够构建出更简洁的分类器。 数值模拟实验验证了HBILS-SVM算法的有效性,它能够在不牺牲分类性能的前提下,显著减少分类器的复杂度,使其更适合于大规模数据集的处理。因此,HBILS-SVM算法为LS-SVM在大数据环境下的应用提供了新的思路和解决方案。 关键词涉及到的主要概念包括:快速近似算法、贪婪算法、最小二乘支持向量机(LS-SVM)以及稀疏分类器。这篇论文对这些领域的研究者和实践者都具有重要的参考价值,特别是在优化大型数据集上的分类任务时。