基于核函数的层次聚类网络流识别算法优化

1 下载量 102 浏览量 更新于2024-08-31 收藏 261KB PDF 举报
本文主要探讨了"基于层次聚类的网络流识别算法研究"这一主题,作者丁伟、徐杰和卓文辉在2014年10月发表于《通信学报》上。他们的工作主要集中在如何通过结合核函数理论和聚类分析技术,提升网络流量识别的效率与准确性。 首先,他们提出了一个改进的网络流识别方法,核心在于利用对称不确定性原理来挑选出与流量识别最为相关的特征测度。对称不确定性是一种衡量数据不确定性的统计量,在这个上下文中,它被用来筛选出网络流数据中最关键的属性,从而减少冗余信息,提高识别效率。 接着,他们利用核函数定理将选择的网络流测度进行高维映射。核函数是一种非线性转换,它允许在低维度数据上执行非线性操作,然后在高维度空间中进行计算。这样做的目的是将复杂的数据结构转换到一个更容易处理的抽象空间,使得聚类效果更为精确。 他们将测量的高维空间距离作为评估不同类别之间差异的标准,这有助于更好地划分网络流量的不同类型。这种方法避免了传统聚类可能遇到的局部最优问题,提高了聚类结果的稳定性。 为了进一步优化聚类过程,他们引入了光滑因子、轮廓系数和不确定熵等指标。光滑因子可以帮助控制数据点在不同类别的平滑过渡,保证聚类的连续性;轮廓系数衡量了样本点与其所在簇内其他样本的紧密程度和与其他簇的分离程度,有助于调整聚类的紧密度和分离度;不确定熵则用于衡量分类的不确定性,有助于防止过拟合和欠拟合。 实验结果显示,这种基于层次聚类的网络流识别算法具有显著的优势。它不仅生成的聚类结果更加均匀,没有出现某个类占据过大比重的现象,而且能够有效地检测出网络流中的大部分流量,这对于网络监控和流量管理具有实际价值。 这项研究通过巧妙地结合对称不确定性和核函数映射,提供了一种有效的网络流量识别方法,对于网络流量的自动化管理和异常检测有着重要的理论和实践意义。