DA-GCN煤矿行为识别:提升模糊监控视频行为检测准确性

需积分: 48 6 下载量 139 浏览量 更新于2024-08-06 1 收藏 775KB PDF 举报
"该文提出了一种基于动态注意力与多层感知图卷积网络(DA-GCN)的煤矿人员行为识别方法,旨在解决煤矿监控视频模糊且行为复杂导致的识别准确性低的问题。通过Openpose算法提取人体关键点,然后利用D-GCN和TCN分别提取空间和时间特征,动态注意力机制则强化了对关键帧和骨架的关注,以提高识别效果。该方法在Cumt-Action数据集上的最高准确率达到了99.3%,表现出优越的性能。" 在煤矿安全生产中,视频监控是确保安全的重要手段。然而,由于煤矿环境的特殊性,监控视频通常存在模糊和复杂背景,这使得常规的行为识别方法在识别煤矿人员行为时面临挑战。为此,研究者提出了一种基于DA-GCN的方法,该方法首先运用Openpose算法,从输入的监控视频中提取出人体的18个关键点信息,这些信息包括3个维度(X, Y, Z),以减少模糊背景的干扰。 接着,DA-GCN的核心是动态多层感知图卷积网络(D-GCN),它能有效地提取人体关键点之间的空间关系特征。D-GCN通过多层感知结构,能够学习到更深层次的动作模式,增强了模型对复杂行为的理解能力。同时,结合时间卷积网络(TCN),DA-GCN可以捕捉到时间序列中的动态变化,提高了对各种动作的泛化能力。 动态注意力机制的引入是该方法的另一大亮点。这一机制允许网络自动聚焦于行为的关键帧和关键骨架,通过增强对这些重要信息的注意力,有效降低了视频质量差对识别准确性的影响。最后,通过Softmax分类器,DA-GCN将识别出的行为分类为站立、行走、坐、跨越和操作设备等五种类型。 为了验证DA-GCN的有效性,研究人员构建了一个专门针对煤矿场景的Cumt-Action数据集,并进行了实验。实验结果显示,DA-GCN在Cumt-Action数据集上的最高准确率高达99.3%,召回率达到98.6%。此外,DA-GCN还在公共数据集NTU-RGBD上表现出高识别准确率,进一步证明了其在行为识别领域的优越性能。 DA-GCN是一种高效的煤矿人员行为识别技术,通过巧妙地融合关键点提取、空间和时间特征学习以及动态注意力机制,成功解决了煤矿监控视频模糊条件下的行为识别难题,为煤矿安全生产提供了有力的技术支持。