SMOTE-SVM算法在不平衡交通事件检测中的应用

需积分: 50 3 下载量 35 浏览量 更新于2024-08-11 1 收藏 1.24MB PDF 举报
"面向不平衡数据集的SMOTE-SVM交通事件检测算法 (2012年)" 本文主要探讨了在处理交通事件检测时遇到的一个常见问题,即不平衡数据集。在实际交通监控中,正常运行状态的数据远超交通事件状态的数据,这会导致传统机器学习算法在训练过程中过于关注多数类(正常状态),而忽视少数类(事件状态),从而影响事件检测的准确性。作者郑文昌、陈淑燕和王宣强提出了一个基于SMOTE(Synthetic Minority Over-sampling Technique)算法和支持向量机(Support Vector Machine, SVM)的解决方案。 SMOTE是一种合成过采样技术,专门用于处理不平衡数据集。它通过生成新的少数类样本,使得两类样本数量达到平衡,从而在训练过程中提高少数类的影响力。在交通事件检测的背景下,SMOTE算法被用来生成虚拟的交通事件样本,以增加事件状态的数据量,使得训练集中的正常状态和事件状态样本比例更加均衡。 接着,他们利用SVM作为分类器。SVM是一种强大的监督学习模型,尤其在处理小样本和非线性问题上表现优秀。在经过SMOTE处理后的平衡数据集上训练SVM,可以更好地捕捉到交通事件的特征,提高分类器对事件状态的识别能力。 实验部分,研究者使用了美国I-880高速公路的交通数据来训练和测试该SMOTE-SVM算法。通过对比分析,结果显示基于SMOTE-SVM的交通事件自动检测(AID)算法显著提高了检测率,并减少了平均检测时间,这对于实时的交通监控系统至关重要,因为它能更快地发现并响应交通事件,减少事故的影响,保障道路的安全和畅通。 这篇论文提出了一个有效的策略,即结合SMOTE和SVM,来解决交通事件检测中的不平衡数据集问题。这一方法不仅有助于提升检测系统的性能,还为其他领域中类似问题的解决提供了参考。关键词包括交通事件检测、不平衡数据集、SMOTE算法和支持向量机,表明该研究聚焦于解决特定领域的数据处理挑战,具有重要的理论和实践意义。