社交媒体流与机器学习助力巴拿马城交通事故分析

0 下载量 123 浏览量 更新于2024-06-18 收藏 2.85MB PDF 举报
"这篇论文探讨了利用社交媒体流,特别是Twitter上的信息,来分析和预测巴拿马城的交通事故。通过机器学习技术,尤其是支持向量机(SVM)、朴素贝叶斯(Naive Bayes)、随机森林(Random Forest)和XGBoost算法,构建了模型以识别交通事件和事件类型。研究涵盖了2014年至2022年的约20万条推文,分类准确率高达92%以上。最佳性能由计数向量和随机森林模型实现,并开发了一个交互式网页界面(http://www.traficoya.com/pty.com/)展示实时数据和推文流,为交通管理和公众提供了实时信息平台。" 本文首先指出,交通拥堵是全球大城市普遍面临的问题,不仅影响社会经济活动,还可能带来环境问题。为了缓解这一问题,智能交通系统(Intelligent Transportation Systems, ITS)的应用日益受到重视,尤其是在信息和通信技术的融合中。通过对社交媒体数据的分析,可以更快速地发现和理解交通状况。 文章详细介绍了研究方法,主要包括两部分:一是从非结构化的社交媒体文本中提取有价值信息,采用了特征工程的方法,如计数向量(CountVectorizer)和TF-IDF(词频-逆文档频率),将推文转化为可用于机器学习的结构化数据。二是构建分类模型,包括训练和评估四个不同的机器学习算法,用于区分与交通事件相关的推文和非事件推文,以及识别事件的类型(事故、危险或障碍)。 实验结果表明,这些模型在识别交通事件上有显著效果,特别是计数向量和随机森林模型的组合,其分类准确度超过97%。这样的高精度对于实时交通管理至关重要,因为它能帮助快速定位和响应事故,从而减少交通拥堵。 此外,开发的图形用户界面(GUI)进一步增强了系统的实用性,它展示了处理后的数据结果,并且可以实时流式传输推文信息。这个界面的上线,即http://www.traficoya.com/pty.com/,为巴拿马城的交通管理部门和公众提供了一个直观、实时了解交通事件的工具,有助于提升交通事件的响应速度和决策效率。 这篇研究展示了社交媒体分析和机器学习在智能交通系统中的潜力,通过整合非传统数据源,可以有效提升城市交通管理和公共服务的质量。这种方法对于其他类似城市来说具有很高的参考价值,可以作为解决交通拥堵问题的一种创新手段。