CNN与HOG特征决策级融合图像识别算法

需积分: 47 28 下载量 42 浏览量 更新于2024-09-07 4 收藏 826KB PDF 举报
"这篇论文探讨了一种基于CNN与HOG特征的决策级融合图像识别算法,旨在解决卷积神经网络模型调整繁琐的问题,通过结合两种特征来提高图像识别的准确性。" 在这篇由王康和陈振学共同撰写的论文中,主要关注的是图像识别技术在计算机视觉领域的应用。随着深度学习的发展,卷积神经网络(CNN)已经成为图像识别的主流模型,因其在图像处理中的优异表现。然而,CNN的一个挑战在于针对不同样本可能需要调整模型参数,这是一项耗时且复杂的工作。 为了解决这一问题,论文提出了一个创新的决策级融合算法,它结合了CNN特征和HOG(Histogram of Oriented Gradients,方向梯度直方图)特征。HOG特征是传统计算机视觉中的特征提取方法,擅长捕捉物体的边缘和形状信息,而CNN则能从更深层次理解图像内容。论文中,作者首先从原始图像中提取这两种特征,然后利用支持向量机(SVM)作为分类器对它们进行独立预测。最后,通过设置权重进行决策级融合,整合两种预测结果,从而利用多源特征的优势。 实验在多个不同的数据库上进行,结果显示这种方法能够有效提高图像识别率,而且不需要对基础的CNN模型进行复杂的调整。这表明,将传统的特征提取方法(如HOG)与深度学习模型(如CNN)相结合,可以在保持效率的同时提升识别性能,为图像识别提供了新的思路。 论文的关键点包括: 1. CNN特征:深度学习中的关键组件,特别适用于图像识别任务,能自动学习并提取高层语义特征。 2. HOG特征:一种用于物体检测的传统特征,通过描述图像局部区域的梯度方向直方图来捕捉物体轮廓。 3. SVM分类器:一种强大的监督学习模型,用于将CNN和HOG特征转化为预测类别。 4. 决策级融合:将不同模型的预测结果结合,通过权值分配来优化最终决策,提高整体识别准确率。 5. 图像识别:研究的核心主题,涉及计算机对图像内容的理解和分类。 这篇论文提供了一种有效的方法,通过融合传统和现代的特征提取技术,简化了CNN模型的调整过程,同时提升了图像识别的性能。这种方法对于计算机视觉和深度学习领域的研究具有重要的参考价值。