2012
年
3
月
第
43
卷第
2
期
内蒙古大学学报(自然科学版〉
J ournal
of
Inner
Mongolia
University
CNatural
Science
Edition)
文章编号:
1000-1638
(2012) 02-0204-04
Mar.
2012
Vo
l.
43
No.2
校园网络流量分流过程的分析与程序实现骨
新夫,任振寰
(呼和浩特职业学院,呼和浩特
01005
1)
摘要:随着近年来网络使用的普及,针对网络流量分析领域的研究越来越多.提出了各种流量
分类算法,其最终目的是为了更好地识别网络带宽中的流量组成.基于对多种不同的流量分类
算法的研究发现,网络流量的成流过程作为流量分类算法的基础性工作起着不可或缺的作用,
并发现数据包成流的定义也各不相同.描述了一种基于数据包五元组的网络流量成流过程,对
某校园网络流量实现了离线式的数据包成流,并针对成流过程中所出现的一些问题进行分析,
给出可能的解决方案.
关键词:网络流量分类;网络流量分流;校园网络流量
中图分类号
:TP393.07
文献标志码
:A
互联网的普及对网络性能和网络有效带宽的需求越来越大.尤其在
P2P
网络出现之后,由于用
户对网络带宽的肆意抢占,而造成大量的网络流量,出现网络拥堵现象,使得其他用户无法有效地获
取所需的网络服务.
为了能够更为有效地提高网络服务质量,增加网络有效带宽,各种网络流分类方法不断出现.无
论哪种网络流量分类算法,将流量细分成流文件过程的基础性作用是不容忽视的.该过程是将具有相
同五元组(源
IP
地址,目的
IP
地址,源端口号,目的端口号,协议〉信息的数据包进行分类,形成一个
完整的流文件.尽管该过程的机制较为简单,但它是各种分类技术的基础工作.数据包成流过程在数
据集较小的情况下可以得到较好的时间复杂度以及空间复杂度.对于几个
G
甚至几百
T
的数据集来
说,时间复杂度要求较高.因此,如何更高效地完成流文件信息的读取工作对数据包成流显得尤为重
要.
本文基于
windows
环境下,对内蒙古某高校网络中心出口流量进行实时捕获后,基于离线式单
线程的分流方式对随机选取的一段连续时间的数据集进行流量成流,基于不同时间间隔的数据集给
出不同的数据分析,并探讨了分流时所遇到的不同问题.
1
相关工作
目前在网络流量分类领域中针对网络流量识别的算法确实不在少数
.90
年代初出现的基于周知
端口号的流量分类算法,根据
IANA(the
Internet
Assigned
Numbers
Authority)
对不同类型的应用
分配固定的端口进行流量识别.
P2P
网络所采用的动态端口技术,令该分类方法已基本不再有效.如
文献
OJ
所述,
2004
年仅有
1%
的
BT
流使用非标准端口号,而
2007
年约
92%
的
BT
流使用非标准端
口进行通信,因此基于端口号的流量分类技术几乎完全无效.
随着
P2P
网络的兴起,针对网络流量分类的算法出现空前的规模,其中以对
P2P
类别流量识别
特收稿日期
:2011-11-20
作者简介:新
夫(1
959
一)
,男(蒙古族)
,内蒙古呼和浩特人,副教授.研究方向
z
电子商务、网络技术、网络安
全.