基于数据挖掘的入侵检测：改进K-means算法研究

需积分: 9 101 浏览量更新于2024-09-08 收藏 1.24MB PDF 举报

"本文主要探讨了改进KMeans算法在入侵检测系统中的应用，针对传统KMeans算法的局限性，提出了一种新的改进策略。文章首先介绍了网络安全的重要性以及入侵检测系统的必要性，然后详细阐述了KMeans算法的基本原理及其在大数据集处理上的优势。接着，提到了传统KMeans算法的缺陷，如对簇形状的不敏感和对高维数据处理的挑战，并列举了一些已有的改进算法。重点介绍了文献中提出的一种基于数据样本点密度选择初始聚类中心的改进方法，虽然这种方法提高了检测效果，但仍然存在随机性问题。最后，作者提出了自己的研究，即在数据挖掘技术背景下，如何进一步优化KMeans算法以提升入侵检测的准确性。" 在入侵检测系统中，KMeans算法是一种常用的聚类方法，它通过迭代寻找最佳的聚类中心，将数据分到最接近的簇中。然而，传统KMeans算法存在几个关键问题：一是对初始聚类中心的选择敏感，可能导致不同的聚类结果；二是对非凸形状的簇识别能力较弱；三是处理高维数据时效率下降。为了克服这些问题，研究者们提出了各种改进策略，比如动态调整K值、使用更复杂的距离度量或优化初始化过程。文献中提到的改进KMeans算法是基于数据样本点的密度来选择初始聚类中心，这种方法理论上可以更好地捕捉数据的局部结构，从而提高聚类质量。然而，由于聚类中心的选取依然带有一定程度的随机性，这可能导致检测结果的不稳定性。因此，作者在本文中进一步探索如何减少这种随机性，提升入侵检测的精确性和稳定性。通过结合数据挖掘技术，作者可能采用了如特征选择、降维等预处理步骤，以及结合其他机器学习模型（如决策树、支持向量机）进行集成学习，以增强KMeans算法的性能。这样的方法可以更好地识别异常模式，提高入侵检测系统的检测率和误报率。该研究对于理解和优化KMeans算法在网络安全领域中的应用具有重要意义，尤其是在面对复杂多变的网络攻击时，改进的聚类算法能够帮助构建更为智能和有效的入侵检测系统。

C omputer Engineering and Applications计算机工程与应用2015，51（17）

1 引言

伴随着计算机应用在全球各个领域的普及，网络正

以其独特的方式改变着人们的学习、工作和日常生活。

然而，随着网络利用率的不断提升，威胁网络安全的手

段也越来越多样化，网络安全问题已经成为当今世界的

重要议题之一。与此同时，静态安全技术无法满足当代

网络安全需求的问题日趋严重，因此一种能够检测入侵

[1]

行为且积极主动的安全防卫技术

—

—入侵检测系统

[2]

（Intrusion Detection System，IDS）应运而生。

目前，J.B.MacQueen 提出的传统 K-means 聚类算法

是应用于入侵检测系统中最常见的聚类算法之一。传

统 K-me ans 聚类算法在给定

值的情况下，反复迭代直

到平方误差准则函数收敛，输出

个聚类结果集。该

算法是相对可伸缩且高效的，在处理大型数据集方面效

力显著，是解决聚类问题的经典算法之一

[3]

。但是，该算

法在聚类簇形状发现和高维数据处理等方面有其不可

回避的缺点与不足。众多研究者针对传统 K-means 的

不足提出了一系列的改进算法

[4-7]

。其中文献[7]提出了

一种新的基于数据样本点密度选择初始聚类中心的改

进 K-means聚类算法，虽然该算法在检测效果上有很大

的进步，但仍然无法回避产生聚类结果集的随机性。

本研究以基于数据挖掘技术在入侵检测系统中应

改进 K-mea ns算法在入侵检测中的应用研究

王茜，刘胜会

WANG Qian, LIU She ng hui

重庆大学计算机学院，重庆 400044

College of Compute r Science, Chongqing Un iversity, Chongqing 400044, China

WANG Qian, LIU Shenghui. Application rese arch of improved K-means algorithm in intr usion detection. Computer

Eng ineering and Applications, 2015, 51（17）：124-127.

Abstract：An imp roved K-means clustering alg orithm is put forward on basis of the split-m erge method for the purpose

of remedying defects both in determination of value in K and in selection of initial cluster centre of traditional K-means

clustering. The concept of independence degree of date is incorporated into the exp erimental date subset construction theory,

using independence degree to evaluate the importance of nature. The database is merged into several classes in respect of

density of date points, the combination of the minimum spanning t ree algorithm and traditional K-means clustering alg o-

rithm is conducive to the achievement of splitting. The KDD Cup99 database is applied to conduct simulation experiment

on the application of the improved algorithm in intrusion detection. The results indicate tha t the improved algorit hm pre-

vails over traditio nal K-me ans algorithm in detection rat e and false alarm rate.

Key words：intrusion detection; data mining; clustering algorithm; K-means clustering; minimum spanning tree

摘要：为了弥补传统 K-means聚类算法在 K值确定和初始中心选择难等方面的不足，基于“合并与分裂”思想，提出

一种改进的 K-means聚类算法。将数据独立程度概念引入实验数据子集构造理论中，利用独立程度评价属性的重要

性；根据点密度将数据集合并为若干类，结合最小支撑树聚类算法与传统 K-means 聚类算法实现分裂；使用 KDD

Cup99数据集对改进算法在入侵检测中的应用进行仿真实验。结果表明，改进算法在检测率和误报率方面均优于传

统 K-means 算法。

关键词：入侵检测；数据挖掘；聚类算法；K-means 聚类；最小支撑树

文献标志码：A 中图分类号：TP391 doi：10.3778/j.issn.1002-8331.1309-0161

基金项目：科技部国家科技支撑计划重点项目（No.2011BAH25B04）。

作者简介：王茜（1964—），女，博士，副教授，主要研究领域为信息安全、电子商务、远程教育课件工具；刘胜会（1 988—），女，硕士

研究生，主要研究领域为信息安全、数据挖掘。E-mail：liushenghui87@163.com

收稿日期：2013-09-12 修回日期：2013-11-15 文章编号：1002-8331（2015）17-0124-04

CNKI网络优先出版：2014-02-13, h ttp://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1309-0161.html

124

下载后可阅读完整内容，剩余4页未读，立即下载

blueforestzhou

粉丝: 0
资源: 2

基于数据挖掘的入侵检测：改进K-means算法研究

改进的K-means算法在入侵检测中的应用

基于‘合并与分裂’的改进K-means算法在入侵检测中的高效应用

改进k-means算法在网络入侵检测系统中的应用研究.pdf

改进k-means算法在网络入侵检测系统中的应用研究.docx

IDS.zip_K._intrusion detection_入侵检测系统_入侵检测聚类_基于K-means的入侵检测系统设计

计算机研究 -改进的聚类分析算法在入侵检测中的研究.pdf

K-PSO聚类算法在入侵检测中的研究.pdf

改进数据挖掘算法在入侵检测系统中的应用_赵艳君1

一种改进的K-means入侵检测算法.pdf

改进数据挖掘算法在入侵检测系统中的应用.pdf

最新资源