拟阵约束下熵聚类方法:子模函数优化模型

5星 · 超过95%的资源 需积分: 0 1 下载量 146 浏览量 更新于2024-08-05 收藏 530KB PDF 举报
"这篇论文提出了一种新的聚类目标函数,该函数结合了图论中的随机路径熵率和平衡项,适用于拟阵约束下最大化子模函数的模型。熵率有助于形成紧凑且均匀的聚类,而平衡函数则鼓励相似度高的对象聚集,并对相似度低的对象进行惩罚。论文首先介绍了权重的定义和计算方法,然后在拟阵约束的框架下,建立了最大化子模函数的优化模型。接着,他们提出了一种基于熵的聚类算法,该算法通过迭代过程寻找最优解。此外,文中还进行了实验验证,对比了与其他聚类方法的性能,证明了该方法的有效性和优越性。" 本文主要探讨了在计算机科学与应用领域,特别是在数据挖掘和机器学习中的聚类问题。聚类是将数据集分成多个组或簇的过程,使得同一簇内的数据点相互之间具有高相似性,而不同簇之间的数据点相似性较低。作者梁国宏、李映、叶萌和李炳杰提出了一种创新性的聚类方法,它在拟阵约束下处理最大化子模函数的问题。 子模函数是一种在特定条件下满足特定性质的函数,它在优化问题中扮演着重要角色,尤其在组合优化和图论中。在这种背景下,子模函数通常用于表示资源分配、覆盖问题或其他需要保持某些递减性质的场景。拟阵是一种抽象的数学结构,可以用来描述各种资源限制,如容量限制或互斥关系。 论文的核心贡献是引入了信息熵的概念来构建聚类目标函数。信息熵是衡量系统不确定性的度量,通过引入熵率,算法能够倾向于生成更加紧凑且均匀的聚类结果。同时,平衡项确保了相似度高的对象更可能被分在同一簇,而相似度低的对象会被分离。这种策略可以提高聚类的稳定性和准确性。 为了实现这一目标,作者设计了一种算法,该算法在每次迭代中更新权重和聚类分配,以最大化熵率和平衡性。算法的效率和有效性通过实验证明,与传统的聚类方法(如K-means、层次聚类等)相比,该方法在处理复杂数据分布时表现出更好的性能。 这篇论文提供了一种新的、基于熵的聚类方法,该方法能够有效地处理具有拟阵约束的子模函数优化问题,为数据聚类提供了一种新颖而有潜力的工具,特别适用于需要考虑资源限制和对象间相似度的场景。