Bezier曲线优化Deformable DETR实现高精度场景文本检测

版权申诉

192 浏览量更新于2024-09-26 收藏 732KB ZIP 举报

资源摘要信息:"本资源主要讨论了目标检测领域中使用Bezier曲线增强Deformable DETR模型性能的方法，以及相关的概念和方法。内容包括对目标检测的定义、任务组成、Two stage和One stage两种主流方法的介绍，以及对NMS、IoU和mAP这些关键指标的详细解释。" 目标检测是计算机视觉的核心问题之一，它包括目标定位和目标分类两个子任务。目标定位是在图像中识别感兴趣的目标位置，而目标分类则是确定每个目标的类别。在目标检测领域，Two stage方法是一种主流的方法。它将检测过程分为两个阶段：第一阶段通过如选择性搜索的方法生成候选框，第二阶段则对这些候选框进行分类和位置微调。Two stage方法虽然准确度较高，但因为处理步骤较多，所以速度相对较慢。该方法的经典算法包括R-CNN系列和SPPNet等。与Two stage方法相对的是One stage方法，它直接利用模型提取特征进行目标的分类和定位，省去了生成Region Proposal的步骤，因此速度较快，但准确度相对较低。One stage方法的代表算法有YOLO系列、SSD系列和RetinaNet等。在目标检测中，非极大值抑制（NMS）是用来从众多预测边界框中选取最具代表性的结果，提高算法效率的一种技术。NMS的基本流程包括设定置信度分数阈值过滤掉低置信度的框，排序选择置信度分数最高的框，以及遍历其他框并删除与当前框重叠度过高的框。交并比（IoU）是评价边界框重叠度的指标，它的值定义为两个边界框重叠面积与它们总面积的比值。IoU值越大，表明预测的边界框越接近真实边界框。均值平均精度（mAP）是评估目标检测模型效果的重要指标，它的值介于0到1之间，值越大表示模型性能越好。mAP是多个类别平均精度（AP）的平均值，而AP则是准确率（Precision）与召回率（Recall）的曲线下的面积。在提到的资源中，代码是在Deformable DETR代码基础上进行修改，并暂存于dev分支中。Deformable DETR是一个利用可变形卷积网络进行目标检测的模型。通过在Deformable DETR基础上引入Bezier曲线进行改进，可以实现场景文本检测，这意味着在检测场景中的文字时，可以更精确地连接检测到的字符目标，提升检测质量。

收起资源包目录

用学习的 Bezier 曲线连接 Deformable DETR 检测的字符目标，实现场景文本检测。（70个子文件）

position_encoding.py 4KB

draw_train_fig.py 2KB

launch.py 9KB

segmentation.py 16KB

coco.py 3KB

ms_deform_attn_func.py 3KB

__init__.py 506B

changelog.md 383B

matcher.py 6KB

make.sh 593B

ms_deform_attn_cpu.h 1KB

v002_resume_from_0010.sh 279B

main_eval.py 14KB

char2num_dict.json 1KB

__init__.py 1KB

r50_deformable_detr_resume.sh 233B

visualizer.py 5KB

main_resume.py 16KB

samplers.py 5KB

ms_deform_im2col_cuda.cuh 53KB

ms_deform_attn_cuda.h 1KB

coco.py 7KB

r50_deformable_detr_plus_iterative_bbox_refinement.sh 198B

benchmark.py 2KB

deformable_detr.py 27KB

misc.py 18KB

__init__.py 598B

panoptic_eval.py 2KB

coco_eval.py 13KB

requirements.txt 43B

train_fig.svg 52KB

__init__.py 584B

v002-bbox-ref.sh 225B

__init__.py 591B

inference_visualization_connect.py 20KB

coco_panoptic.py 4KB

LICENSE 12KB

__init__.py 329B

deformable_transformer.py 22KB

ms_deform_attn.py 7KB

run_dist_launch.sh 812B

visualization.sh 1KB

main.py 16KB

ms_deform_attn_cuda.cu 7KB

r50_deformable_detr_single_scale.sh 185B

log_v002-bbox-ref.txt 1.81MB

transforms.py 9KB

run_dist_slurm.sh 1KB

inference_visualization_gt.py 4KB

plot_utils.py 5KB

ms_deform_attn.h 2KB

test.py 6KB

inference_visualization.py 17KB

v002_eval.sh 161B

v002.sh 190B

r50_deformable_detr_single_scale_dc5.sh 206B

data_prefetcher.py 3KB

r50_deformable_detr.sh 147B

vision.cpp 799B

backbone.py 6KB

box_ops.py 3KB

engine.py 8KB

v002-2stage.sh 215B

v001.sh 247B

r50_deformable_detr_plus_iterative_bbox_refinement_plus_plus_two_stage.sh 236B

README.md 10KB

setup.py 2KB

log_v002.txt 1.81MB

ms_deform_attn_cpu.cpp 1KB

test.py 4KB

共 70 条

生瓜蛋子

粉丝: 3915
资源: 7441

Bezier曲线优化Deformable DETR实现高精度场景文本检测

理解与实现三次Bezier曲线

Bezier曲线算法详解与程序实现

VC++实现Bezier曲线生成

bezier曲线平滑C语言代码-贝塞尔曲线C语言实现-bezier曲线平滑-曲线拟合-贝塞尔曲线

用vc++实现Bezier曲线

Bezier曲线的实现

Bezier 曲线c++实现

Bezier曲线c++实现

Hermite曲线和Bezier曲线实现

编程实现Bezier曲线

最新资源