内核化MinMax聚类:度量自动调整与超参数优化

PDF格式 | 1022KB | 更新于2024-08-26 | 6 浏览量 | 0 下载量 举报
收藏
"这篇研究论文探讨了一种基于内核的MinMax聚类方法,该方法引入了度量化和自动调整超参数的内核化技术,旨在优化聚类过程并提高聚类效果。作者包括Junyan Liu、Yongan Guo、Dapeng Li、Zefeng Wang和Youyun Xu,分别来自中国南京邮电大学的关键实验室和东南大学的国家移动通信研究中心。文章在2019年的《神经计算》(Neurocomputing)期刊上发表,由H. Zhang教授通讯审稿。关键词涉及:内核聚类、度量内核化、自动调整超参数和MinMax优化。 在传统的MinMax聚类方法中,目标是寻找最小最大距离的划分,以确保每个簇内的数据点尽可能接近,同时与其他簇尽可能远。然而,这种方法可能受到原始特征空间中的尺度和分布影响,导致聚类效果不佳。论文提出的方法通过内核化度量解决了这个问题,将数据映射到一个高维的特征空间,使得原本难以区分的数据在新的空间中变得易于分组。 内核的选择对聚类结果至关重要。论文中,作者使用了自动调整超参数的策略,能够根据数据动态地优化内核函数的参数,如高斯核的带宽或多项式核的阶数。这种自适应性使得模型能更好地适应不同数据集的特性,避免了手动调参的繁琐过程。 此外,论文还引入了自动调整簇权重的机制。在聚类过程中,簇的大小和形状可能会因为数据的分布而变化,自动调整簇权重可以确保每个簇的重要性得到适当的考虑,从而提高聚类的稳定性和准确性。 在实验部分,作者对比了提出的内核化MinMax聚类方法与传统方法和其他流行的聚类算法,如K-means和谱聚类。结果显示,新方法在多种数据集上表现出更优的聚类性能,特别是在处理非线性可分和复杂结构的数据时。 这篇论文贡献了一种新的、自动化程度更高的基于内核的MinMax聚类方法,它结合了度量化和超参数自动调整的优势,提高了聚类的灵活性和有效性。这种方法对于处理大规模、复杂数据集的聚类问题具有重要的实践意义。"

相关推荐