基于流量的分类:特征歧视器及其评估数据集

4星 · 超过85%的资源 需积分: 10 28 下载量 105 浏览量 更新于2024-07-31 收藏 373KB PDF 举报
"《基于流量的分类器使用探讨》是一篇经典的流量分析文章,发表于2005年,由Andrew Moore、Denis Zuev和Michael Crogan三位作者合作完成。该论文主要关注在流量分析领域中,如何设计和利用特征(或称为歧视器)进行对象分类。论文的焦点在于提供一组用于评估分类技术的数据集,这些数据集包含大量的TCP流量样本,每个样本(即对象)由一组应用中心类别(通过其他方法确定)和作为输入用于概率分类技术的特征组成。 文章的核心目标是为评估分类算法的性能提供标准化的数据资源,通过这些数据,研究人员可以测试和比较不同分类器的效能。每个对象(TCP流量流)的特点不仅限于其所属的应用类别,还涵盖了那些通过概率模型提取的额外特征,如包速率、包大小分布、时延特性等,这些特征对于理解网络行为和区分不同类型的流量至关重要。 此外,作者还详细描述了数据集的构建过程,包括如何收集和标记来自客户端与服务器之间的TCP数据流,以及如何确保手工地对这些数据进行分类,以便为机器学习模型提供高质量的训练样本。通过对这些特征的深入分析,论文旨在促进流量分类领域的研究进展,并推动算法的改进和优化。 《Discriminators for use in flow-based classification》这篇论文为流量分析研究者提供了一个重要的工具和资源,帮助他们开发出更准确、更具针对性的分类器,以应对日益复杂的网络环境中的流量管理与安全问题。"