2009年 8月
第 12卷第 15期
中 国 管 理 信 息 化
20 09
12 15
基于流数据挖掘的网络流量异常检测及分析研究
魏桂英 姜亚星
北京科技大学 经济管理学院 中国 北京 100083
收稿日期 2009 06 18
作者简介 魏桂英 1969 女 北京科技大 学经济管理学院 讲
师 在读博士 主要研究方向 数据挖掘 网络安全与管理 信息系统
摘要 网络流量异常检测及分析是网络及安全管理领 域的重要研究内容 本文探讨 了网络流量 异常的种类 网
络流量异常检测的方法 分析了基于传统检测方法在网络流 量异常检 测应用中存 在的问题 并 重点对基 于流数据
模型的网络流量异常 检测进行了 研究 综 述了已 有流 数据挖 掘研 究方 法在网 络流 量异常 检测 中的研 究进 展 最
后 本文对现有研究工作存在的问题及未来的研究方向进行了探讨
关键词 网络异常 异常检测 流数据 流数据挖掘
1039691673 0194200915012
中图分类号 27439306 文献标识码 文章编号 1673 0 194200915 0039 04
1引言
随着 的快速发展与日益普及 越来越多的
信息通过网络来传输和存储 网络安全越来越重要
网络流量异常检测及分析是网络及安全管理领域的重
要研究内容 网络流量突发异常是指网络业务流量突
然出现的不正常的重大变化 及时发现网络流量的突
发异常变化对于快速定位异常 采取后续相应措施具
有重要意义
目前网络规模和速度的不断增加 流量突发异常
检测算法需要实时准确地分析处理海量的网络业务量
数据 具有很大的挑战性 流数据模型的提出
1
使得
采用流数据模型来描述网络通信量 解决现有网络流
量异常检测模型存在的不足成为可能 基于流数据挖
掘的网络流量异常检测及分析得到了广泛的研究
11网络流量异常分类
网络流量异常是指对网络正常使用造成不良影响
的网络流量模式 常见的网络流量异常有如下几类
1网络扫描 网络扫描是一种常见的网络异常
流量 它表现为在单位时间内 同一个源 访问大量不
同的目标 或同一目标 的不同端口 目标 通常
是连续的
2 攻击 拒绝服务攻击通常以消耗服务器
端资源 迫使服务停止响应为目标 它表现为大量不
同的源 对同一目标 发送数据包 单位时间内数
据包的量大 数据包长度长 占用大量的带宽资源
3 网络蠕虫病毒 蠕虫病毒利用操作系统的漏
洞主动传播 并且可以在局域网或者广域网内以多种
方式传播 这种网络蠕虫病毒的攻击方式 除了造成
大量的网络流量外 也会消耗大量的系统资源 而且
这类异常通过局部链路上的流量测量数据很难检测
往往需要对全网的流特征进行分析或采用全网的流量
统计分析方法进行检测
4由网络故障和性能问题造成的异常 典型的
网络性能异常是文件服务器故障 网络内存分页错误
广播风暴和瞬间拥塞等引发的网络流量行为的异常
另外 恶意下载 对网络资源的不当使用 会造成流量
异常 导致网络带宽浪费
12 网络流量异常检测方法
近年来 有很多针对网络流量异常检测的研究工作
概括起来 针对网络流量异常检测的方法主要有以下几
种
2
基于特征 行为的研究方法 基于统计的异常检测
基于机器学习的方法和基于数据挖掘的方法等
基于特征 行为的检测研究通过在网络流量数据
中查找与异常特征相匹配的模式来检测异常 因此需
要分类描述网络异常的流量的特征及行为特征 构造
蠕虫分类和 攻击行为等 其缺点是无法检测出未
知的攻击类型 而且需要对规则特征库不断进行更新
基于统计的研究不需要事先知道异常的特征 使
用时间序列的流量数据 采用统计分析技术检测异常
机器学习的方法更强调如何基于更新的信息和以前的
结果来提高系统的性能 异常检测中常用的机器学习
技术包括基于系统调用的序列分析 贝叶斯网路 主成
分分析法 马尔可夫模型等 数据挖掘技术可以用来
从大量审计数据中挖掘出正常或入侵性质的行为模
式
3
后 3种异常检测的方法是对正常的系统网络行
为进行建模 通过与正常模型的比较来进行异常检测
因此能有效地发现已知和未知的攻击
上述传统网络异常检测方法 通常是建立在对整个
数据集进行等同学习的基础上的 检测结果受历史数据
39