图像分割新方法:基于归一化切割的视觉感知组织

需积分: 10 2 下载量 69 浏览量 更新于2024-07-24 1 收藏 2.76MB PDF 举报
"Normalized cuts and image segmentation 是一篇由 Jianbo Shi 和 Jitendra Malik 在 TPAMI 2000 年发表的论文,该论文提出了一个新的解决视觉感知分组问题的方法,主要关注点在于图像分割。" 这篇论文的核心是介绍了一种名为“规范化切割”(Normalized Cuts)的算法,它将图像分割视为图划分问题。在计算机视觉领域,图像分割是指将图像划分为具有相似特征的区域,这对于理解图像内容至关重要。传统的图像分割方法通常侧重于局部特征和图像数据中的一致性,而规范化切割则更倾向于提取图像的整体印象。 论文提出的规范化切割准则考虑了不同组之间的总差异度(total dissimilarity)以及组内总相似度(total similarity)。这个准则通过量化这些因素来衡量分割的质量。为了优化这个准则,作者们引入了一种基于广义特征值问题的有效计算技术。这种方法使得图像分割问题可以被有效地解决。 论文的应用部分展示了该方法在静态图像和运动序列分割上的效果,结果令人鼓舞。关键词包括:分组、图像分割和图划分,表明该工作在这些领域都有重要的贡献。 Wertheimer 在近75年前提出的感知分组和组织的重要性在这篇论文中得到了体现,他强调的相似性、接近性和良好连续性等因素,正是规范化切割算法试图捕捉的关键视觉原则。通过构建图像的图模型,该方法能够识别并分离出符合这些原则的图像区域,从而实现更加智能和准确的图像分割。 "Normalized cuts and image segmentation" 论文为图像处理和计算机视觉领域提供了一种创新的、全局性的图像分割策略,对后续的图像分析和理解研究产生了深远的影响。其理论和技术对于理解和改进图像分割算法,以及在自动驾驶、医疗影像分析、视频处理等实际应用中都有重要意义。