DCA_EAST:改进的自然场景文本检测算法

需积分: 36 2 下载量 110 浏览量 更新于2024-08-13 收藏 1.17MB PDF 举报
本文主要探讨了自然场景下的密集文本检测方法,特别是针对EAST算法的改进。EAST(Efficient and Accurate Scene Text detector)是一种高效且精确的文本检测算法,但在处理密集文本时存在漏检问题,尤其是在后置处理阶段。为解决这一问题,文章提出了Dilated-Corner Attention EAST (DCA_EAST)算法。DCA_EAST通过引入空洞卷积模块和角点注意力模块来增强网络结构,改善漏检情况,特别对于密集文本的检测性能有所提升。 空洞卷积(Dilated Convolution)是一种扩展卷积核的方法,允许模型在不增加参数数量的情况下增大感受野,从而更好地捕捉全局信息,这对于检测图像中的文本尤其是密集文本至关重要。角点注意力模块则专注于识别文本框的角落,进一步提高检测的准确性。 在损失函数设计上,DCA_EAST加入了类别权重因子和样本难度权重因子。这些因子考虑了不同类别的文本和样本的难易程度,使得算法在训练过程中更加关注难以检测的文本,提高了检测的全面性和鲁棒性。实验结果显示,该算法在ICDAR2019的ReCTS数据集上取得了93.02%的准确率、76.69%的召回率和84.07%的F-measured值,表现优于AdvancedEAST算法,充分证明了改进的有效性。 另一部分提到了基于生成对抗网络(GANs)的图像清晰度提升技术。在视频监控、军事目标识别和消费摄影等领域,高清晰度图像的需求十分关键。尽管深度神经网络在图像处理中有显著进步,但其结果往往缺乏纹理细节,图像边缘过于平滑。文章提出的生成对抗网络方法通过改进的残差块和跳跃连接增强了生成网络,同时结合对抗损失、内容损失、感知损失和纹理损失,以更全面地优化图像清晰度。实验证明,这种方法在提升图像清晰度方面提供了良好的视觉体验和定量评估。 总结来说,这两部分内容分别关注了自然场景文本检测的优化和图像清晰度提升的技术。DCA_EAST通过空洞卷积和角点注意力解决了EAST算法在密集文本检测中的不足,而基于生成对抗网络的图像清晰度提升方法则利用深度学习技术改善了图像的视觉质量。这些研究成果在实际应用中具有广阔的应用前景。