电子设计工程
Electronic Design Engineering
第 27卷
Vol.27
第 21期
No.21
2019年 11月
Nov. 2019
收稿日期:2019-03-18 稿件编号:201903114
作者简介:饶亲苗(1995—),男,湖北孝感人,硕士研究生。研究方向:网络安全。
移动应用流量识别是了解网络使用,提供高质
量网络服务与管理的重要一步
[1-3]
。由于移动设备及
应用种类繁多、移动应用与传统互联网应用的差异,
应用级移动流量识别具有挑战性
[4-5]
。
从 国 内 外 研 究 来 看 ,基 于 深 度 包 检 测(Deep
Packet Inspection,DPI)的流量 识别 方法使 用广 泛。
例如,文献[6-7]使用 DPI 方法进行协议层次的流量
识别;文献[8-9]分析了 P2P 流量的基本特性,从而识
别 P2P 流量。以上研究并没有针对音视频流量的识
别,文献[10]利用 DPI 方法识别基于 VoIP 协议的音视
频流量,但是并没有将流量的识别细化到具体的移
动应用层次。文献[11]将 VoIP 流量的识别深入到应
用级别,由于其识别的音视频流量是基于 VoIP 协议
的,因此 也具有 局限 性。文 献[12-14]也利 用 HTTP
报文 头部 User-Agent、Host 等字 段来 识别 移动 应用
基于应用指纹的音视频流量识别方法研究
饶亲苗
1,2
,彭艳兵
2
(1.武汉邮电科学研究院 湖北 武汉 430000;2.南京烽火天地通信科技有限公司 江苏 南京 210000)
摘要:近年来,移动设备和应用程序的数量大幅增长。这个趋势有望使全球移动应用数据流量的
规模在未来的数年里增长数倍,其中音视频流量在数据流量增量中占比最大,到 2020 年,这一占比
将逾七成。然而,目前基于 DPI 的流量识别方法的明显短板就是不能很好的识别加密流量,并且已
有实验表明,音视频应用产生的数据流量中,加密流量的占比非常高,导致传统 DPI 方法不能较好
的识别移动音视频应用产生的数据流量。基于这一现状,比较非加密报文中的 User-Agent、Host 字
段、及加密报文中的 SNI 字段在单独识别应用流量时的识别效果,并利用这 3 个字段生成应用指纹
用以识别音视频流量中的非加密流量及加密流量。
关键词:移动应用;音视频流量;DPI;SNI;加密流量
中图分类号:TP309 文献标识码:A 文章编号:1674-6236(2019)21-0045-05
Research on audio and video traffic identification method based on
application fingerprint
RAO Qin⁃miao
1,2
,PENG Yan⁃bing
2
(1. Wuhan Research Institute of Posts and Telecommunications,Wuhan 430000,China;2. Nanjing
Fiberhome World Communication Technology Co. Ltd.,Nanjing 210000,China)
Abstract: In recent years,the number of mobile devices and applications has grown dramatically. This
trend is expected to increase the scale of global mobile application traffic by several times in the next few
years. Among them,audio and video traffic accounts for the largest proportion of traffic increments. By
2020,this proportion will exceed 70%. However,the obvious shortcoming of traffic identification method
based on DPI is that the encrypted traffic cannot be well classified. And existing experiments show that
the proportion of encrypted traffic in the traffic generated by audio and video applications is very high,
which leads to the traditional DPI method cannot identify the mobile traffic generated by audio and video
applications. Based on this situation,the User-Agent and Host fields in the non-encrypted message and
the SNI field in the encrypted message are compared to identify the applications traffic separately,and
these three fields are used to generate the application fingerprint for identifying the non-encrypted traffic
and the encrypted traffic in the audio and video traffic.
Key words: mobile applications;audio and video traffic;DPI;SNI;encrypted traffic
-- 45