PSENet：2019CVPR论文解析——基于字符亲和力的场景文本检测

图像分割

文本分析

162 浏览量更新于2024-08-30 收藏 997KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"PSENet是2019年CVPR会议上提出的一种新的场景文本检测方法，它通过字符亲和力估计来改进文本区域的检测，尤其在处理任意形状、弯曲或变形的文本上表现优秀。该方法克服了传统词级边界框方法的局限性，结合了合成图像和真实图像的字符级标注进行训练。" 在计算机视觉领域，场景文本检测是一个重要的研究课题，它在多种应用场景中有着广泛的需求，如自动翻译、图像搜索、理解场景、地理定位和无障碍导航等。传统的文本检测方法常依赖于规则的边界框来标识文本，但这种方法在面对文本形状多样性的挑战时显得有限。随着深度学习技术的发展，尤其是卷积神经网络(CNN)的进步，许多基于深度学习的场景文本检测器应运而生，它们在准确性和效率上都有显著提升。然而，这些方法往往聚焦于整词或者单词级别的检测，对于复杂形状的文本，如弯曲、变形的文本，检测效果不理想。 PSENet（Pixel Set Evolution Network）提出了一个新的策略，它引入了字符区域意识的概念，旨在通过探索字符之间的亲和力来更精确地检测文本区域。这种方法的关键在于它能有效地处理单个字符级别的标注问题。在训练过程中，PSENet利用合成图像的字符级标注以及一个学习得到的临时模型来估计真实图像中的字符级信息。通过这种亲和力表示，网络能够学习到字符间的联系，从而更准确地定位文本。为了验证其有效性，PSENet在多个基准数据集上进行了实验，包括TotalText和CTW-1500，这两个数据集包含了大量高度弯曲的文本实例。实验结果显示，PSENet在字符级文本检测方面的性能显著优于现有最先进的检测器，证明了其在处理复杂场景文本图像，尤其是那些有任意方向、弯曲或变形的文本时的优越灵活性。 PSENet通过字符亲和力的建模和像素集演化网络的设计，提供了一种强大的文本检测解决方案，对于复杂形状的场景文本检测具有重要的理论和实际价值。这一方法不仅推动了场景文本检测技术的进步，也为后续研究提供了新的思路和借鉴。

资源推荐

weixin_38739837

粉丝: 2
资源: 912

PSENet：2019CVPR论文解析——基于字符亲和力的场景文本检测

PSENet.pytorch:PSENet的pytorch重新实现

行人重识别近年来顶会论文和代码

psenet自己的阅读笔记-SCUT-CTW1500数据弯曲下载链接以及文本标注格式理解-附件资源

yolo文件和vgg

"Patch-Based Image Segmentation via Spatial-Aware Deep Embedding"，在CVPR 2018中发表，这篇似乎找不到

FileExistsError: [Errno 17] File exists: '/home/stu/cqq/RGBTCC-main/datasets/RGBT-CC-CVPR2021/new_trian_depth_384'

MEX 文件 'D:\ECO-master_CVPR2017\ECO-master\external_libs\mexResize\mexResize.mexw64' 无效: 找不到指定的模块。

怎样写一篇超分辨率的cvpr

cvpr latex

Visual Tracking via Adaptive Spatially-Regularized Correlation Filters(**CVPR2019 Oral**).

cvpr的latex模板

ECCV, ICCV CVPR 关于transformer在遥感领域的论文

cvpr2022论文有那些

找找最近两年ECCV ICCV CVPR中，关于transformer在遥感方面的论文

cvpr latex模版

cvpr 2019之迁移学习:contrastive adaptation network for unsupervised domain a

cvpr模板latex

cvpr中文latex模板

生成特征_CVPR2019 D2-Net关键点检测之特征描述与关键点同时生成

最新资源

Visual Tracking via Adaptive Spatially-Regularized Correlation Filters(CVPR2019 Oral).