端到端视频对象分割：利用位置敏感嵌入与模型自适应

48 浏览量更新于2024-06-20 收藏 3.86MB PDF 举报

"基于学习位置敏感嵌入的视频对象分割任务" 本文主要探讨的是视频对象分割(Video Object Segmentation, VOS)中的一个特定任务——基于边界框信息的视频对象分割(BBox-based Video Object Segmentation, BVOS)。在BVOS任务中，目标是根据视频第一帧中的对象边界框来预测后续帧中的对象掩模。这项任务面临的主要挑战包括相似背景中的对象区分以及目标对象外观随时间的变化。为了解决这些挑战，作者提出了一种端到端的训练网络，该网络利用位置敏感的嵌入(Position-Sensitive Embeddings)来区分相似对象的像素。这种嵌入能够帮助网络更好地理解像素之间的相对位置关系，从而提高前景预测的准确性。具体来说，网络首先接收第一帧的边界框信息，然后通过学习位置敏感的特征，能够在后续帧中识别和分割目标对象。此外，针对目标对象外观变化的问题，文中提出了一种模型自适应方法。该方法在测试视频上预扫描所有帧，生成伪前景/背景标签，随后依据这些标签对模型进行再训练，增强了模型对视频中目标对象变化的适应性。文章中对比了VOS与相关领域，如静态图像的前景提取(Foreground Extraction, FE)和对象跟踪(Object Tracking)。尽管这些任务有一定的相似性，但BVOS的独特之处在于它不仅需要定位对象，还需要持续地生成精确的前景掩模。作者还展示了他们的方法的工作流程，包括前景区域的放大、网络预测以及最终的前景预测融合等步骤。在实验部分，提出的网络在DAVIS和SegTrackv2这两个广泛使用的数据集上表现优越，验证了方法的有效性。位置敏感嵌入这一概念在视频对象分割中的应用为未来的研究提供了新的思路，有助于进一步提升视频理解的准确性和效率。

H. Ci、C.Wang和Y.王

在[28]中，作者提出将人脸图像嵌入到向量中（在单位球面上）。

训练数据是三元组的形式，其中正对之间的距离比负对的距离小一个

裕度。然后，[8，20]中的作者将工作扩展到学习像素级嵌入，例如分

割。它们使用嵌入将像素分组为片段，这些片段被后处理，例如分

割。我们的工作和[8，20]之间的区别是两个折叠。首先，我们的嵌入

是位置敏感的，这提供了增强的能力来区分不同位置中非常相似的对

象就

我们目前的知识水平而言，这并不是最好的选择

。

因此

，

我们

以端到

端的方式将嵌入与前景预测结合，而不是将嵌入用作后处理。

关于模型更新在线模型自适应已被广泛研究用于边界框级别跟踪[9，

18，26]。但是对于像素级模型的在线自适应在[30]中，作者选择预测

前景概率超过某个阈值的像素作为正例。负示例被仔细地选择为（基

于阈值）离最后预测的对象掩模非常远的那些应用这种复杂的基于规

则的选择方法的原因是错误的监督可能会使网络偏向于学习错误的特

征。在线自适应方法与我们的不同之处在于，他们在每个时间步更新

模型相比之下，我们只更新一次模型，这对小部分不准确的监督更鲁

棒，并且对参数选择的依赖性更小。

位置敏感嵌入

像素的LSE不仅依赖于其外观，而且依赖于其相对于其所属对象的空

间位置。这允许嵌入区分不同位置中的非常相似的对象我们共同学习

每个像素

的外观嵌入

和位置嵌入

，它们被融合以生成位置敏感的

嵌入。

这

两个版本的IP地址和IP地址的定义是明确的

。

如果

和

来自于该采

样，

则

。

将

两个像素的嵌入分别定义为

和

。位置

嵌入

对像素与

像素所属的对象的中心之间的空间偏移进行编码。另外，

给

出对象中心，其中pi表示在此上下文中的图像中的像素位置我们

可以想象，如果两个像素属于同一个对象，

则

与c

我们建议共同学习的外观和位置嵌入，这是融合生成LSE。在下面

的小节中，我们将介绍学习外观和位置嵌入的细节。

3.1

外观嵌入

如果两个像素来自图像中的同一对象，则它们形成正训练对。否则，

它们形成负训练对。外观嵌入

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

端到端视频对象分割：利用位置敏感嵌入与模型自适应

视频对象分割

基于对象的视频分割算法研究与实现

人工智能-深度学习-基于深度学习的视频对象分割方法.pdf

在maskformer出现后，可不可以帮我想几个关于语义分割或实例分割或全景分割或视频方向的分割的论文题目以及创新点研究方向

基于fft的水印嵌入法

实现一个基于视频的数字水印嵌入系统。

写一个Python读取office嵌入文件对象的代码

photoshop 事件管理器 添加 置入嵌入对象 事件

最新资源

photoshop 事件管理器添加置入嵌入对象事件