Curve-GCN:快速交互式图形卷积标注技术

需积分: 0 0 下载量 116 浏览量 更新于2024-08-05 收藏 3.79MB PDF 举报
"快速图卷积交互式标注1" 这篇摘要介绍了一种名为"Curve-GCN"的新框架,用于快速的交互式对象标注。在计算机视觉领域,手动标注物体边界是一项耗时的工作。传统的解决方案如Polygon-RNN通过循环神经网络(CNN-RNN)架构生成多边形标注,允许用户进行交互式修正。然而,Polygon-RNN存在顺序预测的局限性,即每次只能预测一个顶点,这使得标注过程效率不高。 Curve-GCN的创新之处在于它利用图卷积网络(GCN)同时预测所有顶点,从而消除了顺序预测的限制。这种方法提高了标注效率,不仅适用于直线型物体,也适用于曲线型物体,支持以多边形或样条曲线的形式进行标注。此外,Curve-GCN模型是端到端训练的,这意味着它可以整合整个标注过程,从输入图像到输出标注,无需额外的后处理步骤。 实验结果表明,Curve-GCN在自动模式下优于现有的所有方法,包括强大的PSP-DeepLab等。在交互式模式下,其效率比优化过的Polygon-RNN++显著提高。具体性能上,Curve-GCN的自动模式运行时间为29.3毫秒,而交互式模式仅为2.6毫秒,分别比Polygon-RNN++快约10倍和10倍,极大地提升了标注速度和用户体验。 这一框架的提出对于提高计算机视觉应用中的图像标注效率具有重要意义,特别是对于需要大量手动标注的数据集,如自动驾驶、遥感图像分析等领域。通过引入图卷积网络,Curve-GCN不仅优化了标注速度,还增强了模型的泛化能力,有望推动图像分析和理解技术的进步。