没有合适的资源?快使用搜索试试~ 我知道了~
基于弦走行走的叶子形状描述和识别方法
61190摘要:在任意变形下有效地描述和识别叶子形状,特别是从大型数据库中,仍然是一个未解决的问题。在这项研究中,我们尝试了一种新的策略,通过沿着穿过形状的一束弦走来描述形状,以测量所经过的区域。通过弦走行走开发了一种新颖的弦束行走(CBW)描述符,通过对行走弦上的形状图像函数进行积分,反映轮廓特征和形状的内部属性。对于每个轮廓点,弦束组合多对弦走行走,建立了一个从粗到细的描述框架。所提出的CBW描述符对旋转、缩放、平移和镜像变换不变。为了实现高效而有效的形状匹配,提出了一种改进的Hausdorff距离编码的对应信息。在实验研究中,所提出的方法在基准测试中以较低的计算成本获得了显著更高的准确性,这表明了这个方向的研究潜力。01. 引言0人类视觉系统高效且具有通过形状识别物体的能力。对于机器视觉,形状最初以二进制掩码表示,或者在从图像中分割出对象后,进一步从二进制模式中提取轮廓。形状分析的任务是捕捉与变换(缩放、旋转、镜像、关节等)效果无关的几何信息,以实现目标识别的最终目标。然而,从可用的形状的二进制掩码或轮廓表示到成功识别对象,存在许多挑战,如对象的刚性和非刚性变形、噪声、部分遮挡、类内变化等。0各种实时应用的高效需求。开发一种能够解决所有上述问题的方法可能是不现实的。例如,基于部分的算法对处理关节变形非常有效。然而,对于噪声数据,它对分割错误非常敏感。那些能够处理部分遮挡的方法可能不适用于实时应用,因为它们的计算成本很高。因此,开发一种能够平衡多个方面需求而不是满足所有需求的方法是可行的。自动植物叶片识别是计算机视觉的一个重要应用,并且近年来已经得到了广泛的研究。然而,由于叶子形状的小的类间差异(见图5和图6),大的类内变化(见图7)以及特别是叶子形状的自然自重叠(见图1第一行中显示的中间叶子图像),有效和高效地识别叶子形状的问题仍未得到很好解决。例如,我们尝试了最先进的方法,如形状上下文[15]、内部距离形状上下文[9]和高度函数[36],来区分图1第一行中显示的叶子形状,它们都认为中间那片叶子与右边那片更相似,而不是左边那片。0图1.三张叶子图像(左边的两片叶子属于同一物种)及其对应的外轮廓。仅从外轮廓来看,中间那片自重叠的叶子可能被错误地识别为右边那片的物种。本研究旨在开发一种形状描述和匹配方法,以有效和高效地识别叶子形状。采用弦束的分层框架,通过弦束行走来测量穿过形状的区域。通过弦束行走,开发了一种新的弦束行走(CBW)描述符,通过对行走弦上的形状图像函数进行积分,反映轮廓特征和形状的内部属性。对于每个轮廓点,弦束组合多对弦束行走,建立了一个从粗到细的描述框架。所提出的CBW描述符对旋转、缩放、平移和镜像变换不变。为了实现高效而有效的形状匹配,提出了一种改进的Hausdorff距离编码的对应信息。在实验研究中,所提出的方法在基准测试中以较低的计算成本获得了显著更高的准确性,这表明了这个方向的研究潜力。0行走和测量弦束是否能更好地描述叶子形状?Bin Wang 1,Yongsheng Gao 1,Changming Sun 2,Michael Blumenstein 3,John La Salle 401澳大利亚格里菲斯大学工程学院 2澳大利亚CSIROData61,Epping,NSW 1710,澳大利亚03澳大利亚悉尼科技大学FEIT4澳大利亚CSIRO国家研究集合澳大利亚生活图集bin.wang@griffith.edu.au,yongsheng.gao@griffith.edu.au,changming.sun@csiro.au,michael.blumenstein@uts.edu.au,john.lasalle@csiro.au 61200在这个框架中,提出了一种称为弦步行(CBW)描述符的方法。在这个框架中,使用形状区域上的弦积分,称为弦步行,来捕捉形状的内部结构信息,并包括由弦对步行形成的角度来反映边界属性。从一个共同的轮廓点发出的多个弦对步行被分组,为形状提供了一个由粗到细的描述。所提出的CBW描述符对旋转、缩放、平移和镜像变换具有不变性,并具有处理自重叠叶形状的潜力。实验研究证明了它在现有方法上的更好性能。02. 相关工作0许多形状描述符已被提出,并可分为全局方法和局部方法。全局方法从轮廓特征中提取形状特征,通常表示为1-D函数,或者从形状区域特征中提取形状特征,通常表示为2-D函数,并将它们汇总为特征向量或整体形状描述的特征序列。然后可以使用范数度量,例如欧几里得距离,来测量形状距离。这个组的经典描述符是由将形状图像函数投影到单位圆内部定义的一组正交基函数上生成的Zernike矩(ZM)[2]。Yap等人[12]提出了一种新颖的2D变换,称为极坐标谐波变换(PHTs),用于提取旋转不变的特征。与Zernike矩一样,PHTs基于一组正交投影基。然而,它的计算复杂度明显低于Zernike矩。最近,广为人知的Radon变换及其推广的Trace变换已被广泛用于形状描述和匹配[7][11][18][29][30][33]。这些方法通过对形状区域上的线积分精细地捕捉内部结构信息。最近,Hong和Soatto[34]使用一系列各向同性核函数开发了一种不变且鲁棒的形状描述符。上述方法从整个形状区域中提取形状描述符。还有另一组全局方法仅从轮廓中提取特征。流行的方法是各种谱方法,如傅里叶描述符[8][21]和小波描述符[22]。最近,胡等人[3]提出了一种新颖的描述符,称为多尺度距离矩阵(MDM)[3],它使用多个尺度上轮廓点之间的距离构建矩阵,以反映轮廓点的空间关系,其中轮廓点之间的距离可以是欧几里得距离或其他度量,如内部距离[9]。为了提供一种更有效且高效的形状检索方法,最近的工作[10]提出了一种层次化的字符串切割方法,用于提取一组几何特征,称为字符串切割,用于表征曲线的空间配置0相对于它们的字符串,对于局部方法,为形状的每个视觉基元(如点、轮廓片段和多边形边缘)提取一个描述符。与比较形状的基元相关联的局部描述符用于建立它们之间的对应关系,并将得到的匹配成本用作形状距离度量。形状上下文[15]为每个轮廓点构建直方图,以编码所有轮廓点与其相对空间分布(距离和方向)的信息。内部距离形状上下文[9]用内部距离替换了欧几里得距离,内部距离定义为形状轮廓内的地标点之间的最短路径的长度,以有效地捕捉形状的部分结构。距离集[16]提出了一种使用围绕该点的特征点的空间配置的丰富局部描述符,其中空间排列由该点与其邻域的特征点之间的距离集合来表征。高度函数[36]使用所有轮廓采样点到给定轮廓点上的切线之间的高度值(透视距离)来生成捕捉轮廓点与给定点的几何关系的局部描述符。上述方法侧重于提取形状轮廓点的空间排列信息。还有许多方法关注描述形状轮廓的曲率属性或弯曲潜力。Alajlan等人[17]提出使用由轮廓点形成的三角形的面积来测量不同尺度上每个点的凸度/凹度。积分不变量[13]引入了一类在形状上进行的积分算子的函数,使得所得到的描述符对高频噪声和小变形具有鲁棒性。它已经被有效地应用于叶子识别[19]。轮廓灵活性[23]努力表示每个轮廓点的可变形潜力,并认为这个描述符可以精细地提取局部和全局特征。在[24][25][27][28]中可以找到许多其他类似的方法。03. 提出的方法0我们首先定义弦行走对来编码形状的局部判别信息,然后引入弦束行走来呈现形状的粗到细描述。从弦束行走中导出的不变性被提出和讨论。最后,它们被用于形状距离的度量。03.1. 弦对行走0给定一个二值形状图像B(x,y),形状区域S(表示为Ω)由图像平面�²中的像素子集形成。让Ω'是包围S的外轮廓,它可以表示为弧长参数化形式[23]:θ = l�, θ', t ∈ [0,1],其中l�, θ' ∈Ω。由于Ω是一个闭合轮廓,我们有θ' + θ = 1和θ' - θ = 1。对于轮廓点p = (θ,θ'),我们沿着一对弦chord1和chord2行走,其端点分别为p1 = θ' + θ和p2 = θ' -θ,其中t ∈ [0,1]。 ̅̅̅̅̅̅, 61210参数化形式[23]:θ = l�, θ', t ∈ [0,1],其中l�, θ' ∈ Ω。由于Ω是一个闭合轮廓,我们有θ' + θ =1和θ' - θ = 1。对于轮廓点p = (θ, θ'),我们沿着一对弦chord1和chord2行走,其端点分别为p1= θ' + θ和p2 = θ' - θ,其中t ∈ [0,1]。0的路径有时会落在形状区域内,有时会落在形状区域外。我们记录在形状区域内行走的长度(l1和l2)和在形状区域外行走的长度(l1'和l2'),可以用数学方式表示为:0特征向量0特征向量 = − l2 + l cos(θ1 − θ2), l sin(θ1 − θ2)0的0特征向 l1 + l cos(θ1), l sin(θ1)0的0和0特征向0特征向量 = 1 − l2 + l cos(θ1 − θ2), l sin(θ1 − θ2)0的0特征向 l1 − l2 + l cos(θ1 − θ2), l sin(θ1 − θ2)0生成0其中,l1和l2是弦对chord1和chord2的长度,θ1和θ2是弦对chord1和chord2的方向。上述定义的I1和I2是形状图像函数在弦对chord1和chord2上的积分,而I1'和I2'是形状图像的补函数在弦对chord1和chord2上的积分。然后我们使用它们生成一个五元组。0特征向量 = l1, l2, sin(θ1 − θ2), θ1, θ2。0我们称之为弦对行走。图2给出了弦对行走的图形说明。0图2.弦行走对概念的示例说明。左:从轮廓点发出的一对弦放在形状图像平面上进行行走。右:得到的弦行走对(粗体部分表示在形状区域内行走的路径,其余部分表示在形状区域外行走的路径)。0弦对行走是一种局部描述符,用于捕捉轮廓点邻域的几何特征。它的前两个元素和后两个元素分别反映了轮廓点左邻域和右邻域的特性,而中间元素sinθ−θ'度量了轮廓点处的曲率特性,其中sinθ−θ'的值大于θ、小于θ'和等于θ分别表示凸、凹和平坦特性。弦对行走捕捉了轮廓点周围丰富的几何信息,包括轮廓特征和内部区域的结构信息。这种理想的特性使得所提出的弦对行走描述符明显优于那些只捕捉轮廓的曲率特征或可弯曲特性的方法,如积分不变量[13]、三角形特征[6][7]、拱高度[25]和轮廓灵活性[23]。03.2. 弦束行走0在前一节中,对于给定的轮廓点,我们从该点开始向其右邻居轮廓点和左邻居轮廓点行走,分别得到一个弦对行走描述符来捕捉其邻域的几何特征。单个弦对行走可能不具有足够的区分能力,而一组弦对行走可以大大提高描述符的区分能力。通过改变参数k,并使其取值为k1,�,k2,我们可以从公共点出发得到k个弦对行走,并将它们组合成弦束行走(CBW)。0是一个0是0是0图3展示了CBW概念的一个示例说明。现在,对于每个轮廓点,我们构建了一个CBW描述符来编码与其相关的多尺度形状几何信息。事实上,CBW描述符是通过对不同尺寸的弦对行走进行分组得到的。观察图3,我们可以发现弦束的整体几何结构随其所在的轮廓点而变化,这表明弦束中弦对行走之间的空间关系对于形状区分也是有用的。为了将这些有价值的信息包含到CBW描述符中,我们进一步从弦束中提取空间关系特征,具体如下。对于弦束中的两个相邻弦对行走{θ,θ'}和{θ'',θ'''},可以通过以下方式获得它们之间的一对角度θ,θ'和θ'',θ'''。0θ,θ' = arctan(θ'' - θ) , θ'',θ''' = arctan(θ'' - θ')。 ��61220图3.弦束行走概念的示例说明。上图:从不同轮廓点发出的大小为k的弦束放置在图像平面上进行行走(弦对行走由相同颜色标记)。下图:得到的弦束行走描述符。由于CBW中总共有k个弦对行走,因此有k-1个角度对可用。在图4中,我们给出了一个示例来说明这些角度对,并使用它们生成一个向量。0θ = si0是0是,归一化后的描述符。0用于反映弦束的整体空间排列。然后,可以通过方程(4)进一步扩展CBW描述符。0θ,θ' = {θ,0是0θ = sin(θ,θ') - sin(θ'',θ'''0是0是。0是0图4. 从图3左上方的弦束中得到的角度对θ,θ'和θ'',θ'''的示例说明。0此时,我们为每个轮廓点构建了一个维度为d的描述符。03.3. 不变性和归一化0一个好的描述符应该具有平移、缩放、旋转和镜像不变性。在下面,我们讨论了所提出的CBW描述符的不变性属性。由于形状函数的平移结果对于形状区域的所有点,包括轮廓点,都是相同的平移。因此,所提出的CBW描述符对平移具有固有的不变性。当形状被角度为θ旋转时,弦对行走的长度特征和方向角发生变化,但角度差θ-θ'保持不变。因此,角度差θ-θ'是不变的,θ'也相应地是不变的。在方程(5)中定义的角度对θ,θ'对旋转也是不变的。因此,CBW描述符对旋转具有固有的不变性。对于缩放,方程(3)和方程(5)中的所有角度相关特征都是不变的,只有长度特征发生变化。我们将长度特征的归一化版本作为缩放的描述符。0x′ = x′ − min r′ {r′}0max r′ {r′} − min r′ {r′}0另外三个特征x′,y′,sinθ′也可以通过相同的方式进行归一化处理,使其具有尺度不变性。 ��̅������{��������������, ��������������}����,⋯,�� and for each chord ��������������, we uniformly sample it into � − � points {�������, ����, � =�, ⋯ , � − �}, where � = max�|�� − ����|, |�� − ����|�, namely, the chord �������������� is segmented into V parts of equal length. Let �����, ��� be �������, ���� and ���������, ����� be ��� ���� , ��� �. Since a line segment �������� is fallen in the shape region, if and only if �����, �����������, ������ = �, the variable ���� defined in Eq. (1) can be calculated by 61230对于镜像变换,不失一般性,我们假设形状关于x轴对称,即其图像函数和轮廓参数方程变为x′ = x, y′ = −y, θ′ = −θ, r′= r, θ ∈[0,2π],其中x′,y′是镜像后的坐标,θ′,r′是镜像后的参数。和弦对行走x′,y′,sinθ′ − r′,r′,r′的变化如下:0x′,y′ = r′ − rcosθ′ − x′ + xmax + ymax, xmax − x′, ymax − y′0= asinθ, r − rcosθ, xmax − x, ymax − y, sinθ − ymax0即,参数化轮廓被翻转,每个和弦对行走的前两个元素与最后两个元素交换,中间元素不变。下面,我们来看一下角度对x′,y′的影响:0x,y defined in Eq. (5). 从它们的定义可以得出,它们的镜像变换版本是x,y = −x,y + xmax + ymax = xmax − x, ymax− y0= xmax − x′, ymax − y′ 和0x,y = −x,y + xmax + ymax = xmax − x, ymax − y0所以,根据公式(6),我们有0x = a0y = asinθ, x = r − rcosθ0方法0方法0即,x′ = −x′, y′ = −y′, xmax = −xmax, ymax = −ymax0即,镜像变换只改变了x的符号。然后我们可以进行以下归一化处理:xmax=max|x|,|y|,ymax=max|x|, |y|, sinθmax0−x′, min r′, r′, min r′, r′ 和0x = a0方法0方法0为了消除轮廓翻转的影响,我们将轮廓视为一组点,并忽略轮廓点之间的顺序关系。通过上述处理,CBW对尺度、旋转、平移和镜像变换完全不变。03.4. 实现和时间复杂度0给定一个二值数字图像的对象,如[3][9][13][17][20][36]中的方法,我们采用均匀间隔采样其外轮廓为一个包含T个点的序列:x′,y′,i=1,�,T,其中T是轮廓的长度,K是给定的整数,i是按顺时针方向沿轮廓的顺序的样本点的索引,x′i,y′i是样本点的坐标,我们有xmax = x′T,y′T =y′0。对于每个轮廓点x′i,y′i,我们将其分为一组和弦对:0x,y = ∑r′i,r′i+1sinθi,θi+1 − ∑r′i,r′i+1cosθi,θi+1, i=1,�,T-103.5.形状不相似性度量03.5.形状不相似性度量0我们为每个轮廓点构建了一个CBW描述符,对于每个轮廓点�,�=1,2,...,n,自然而然地进行点匹配,即通过比较它们的相应CBW描述符来匹配一个形状的轮廓点与另一个形状的轮廓点,以测量形状的不相似性。比较两个点的CBW描述符的成本使用它们之间的�距离来衡量。许多方法尝试找到比较形状的轮廓点之间的最佳对应关系,以测量形状的距离。这种方案的一个限制是它的计算成本很高(通常超过轮廓点的数量n)。此外,基于最佳对应关系的形状不相似性度量并不总是适用于那些难以成对匹配的形状(例如复叶形状)的局部细节。在这里,我们提出了一种改进的Hausdorff距离,用于经济形状不相似性度量。给定两个点集�={�1,�2,...,�m}和�={�1,�2,...,�n},其中�和�分别是它们的大小。它们之间的Hausdorff距离定义如下:0���, �� = max(���, ��, ���, ���)0其中 ���, �� = � ��������� − �� ∙ ��������∈��. ���� (16) by ℎ��, �� =�� ����, �� + ∑min��∈� ����, �����∈��. ���� 1 https://en.wikipedia.org/wiki/Information_retrieval. 61240���, �� = max(� ∈� �min(� ∈� ����, � �))0并且���是一种范数度量,例如欧氏距离。这是Hausdorff距离的原始版本的定义。Dubuisson和Jain [14]通过改变���,��的定义提出了一个修改版本,如下所示:0���, �� = �0这是原始版本的Hausdorff距离的定义。Dubuisson和Jain[14]通过改变���, ��的定义提出了一个修改版本,如下所示:0与那些基于一对一对应关系的距离度量不同,Hausdorff距离是一种局部对应匹配方案,因此存在一个集合中的多个点与另一个集合中的同一个点匹配的情况。为了提高Hausdorff距离的性能,我们提出了一个改进版本,其中考虑了全局对应关系。对于每个点� ∈ �,将映射到它的点� ∈�,�=1,2,...,n收集起来形成一个集合:0这是原始版本的Hausdorff距离的定义。Dubuisson和Jain[14]通过改变���, ��的定义提出了一个修改版本,如下所示:0其中���是定义为:0这是原始版本的Hausdorff距离的定义。Dubuisson和Jain [14]通过改变���, ��的定义提出了一个修改版本,如下所示:0令� = {�1,�2,...,�m}为集合�中被集合�中的多个点匹配的点的集合,���是定义为:0这是原始版本的Hausdorff距离的定义。Dubuisson和Jain[14]通过改变���, ��的定义提出了一个修改版本,如下所示:0对于从集合�中的点�� �的所有映射的平均成本,其中� ����的基数。然后,考虑到多个映射到同一点的情况的额外成本被定义为:0上述定义的额外成本 ���, ��编码了一些全局对应信息,并用于修改公式。0然后我们使用公式(14)和公式(18)来衡量两个形状之间的差异。04. 实验结果0为了评估提出的CBW方法的有效性,我们在两个公开可用的叶片数据集MEW2012和ICL上进行了实验研究,并将其性能(准确性和计算速度)与六种最先进的方法进行了比较。其中,Shape Context [15]和Inner Distance Shape Context[9]是经典的形状分析方法,被广泛用于性能比较。HeightFunction [36]、MDM [3]和HSC[10]是最近提出的基于轮廓的形状分析方法,在MPEG-7CE-1数据库和叶片数据库上具有最先进的性能。04.1. MEW2012叶片数据集0中欧木本植物(MEW2012)[37]是一个公开可用的叶片数据集,包含中欧地区的本土或经常栽培的树木和灌木。总共有9745张叶片图像,属于153个物种,每个物种至少有50个样本。每个类别的一个典型样本如图5所示。可以看出,数据集中有很多物种,它们之间的微小差异使得检索任务非常具有挑战性。均值平均精度(MAP)1[4]是评估信息检索系统性能的标准指标,在评估图像检索[5][6][32][35]、语音索引[40]和视频检索[26][39]系统方面被广泛使用。数据集中的每个叶片图像都被视为一个查询,从所有样本中检索出相似的图像。0图5. MEW2012叶片数据集[37]中的153个典型样本,每个物种展示一个样本。 SC+DP [15] 47.94 91.47 MDM-ID-RA [3] 33.71 1.89 HSC [10] 54.98 0.17 61250图6. ICL叶片数据集[3]中的220个典型样本,每个物种展示一个样本。0数据集。提出的方法和六种最先进的方法在MEW2012叶片数据集上获得的MAP得分总结如表1所示。我们还记录了匹配一个查询与包括查询形状特征提取时间和所有比较方法的平均检索时间在内的9745个样本的计算时间。表1.MEW2012叶片数据集上的MAP得分。0算法 MAP得分(%) 平均检索时间(s)0IDSC [9] 45.36 85.230MDM-CD-RM [3] 39.14 1.560高度函数[36] 49.76 97.810可以看出,在这个具有挑战性的数据集中,提出的方法获得了最好的MAP得分62.05%,比第二好的方法HSC高出7.07%,比其他方法高出16%以上。这些令人兴奋的结果表明,提出的CBW方法具有通过叶片形状特征区分植物物种的强大能力。与其他方法相比,提出的方法的检索速度比IDSC[9]、SC+DP [15]和Height Function[36]等方法快12倍以上。尽管提出的方法比其他三种方法慢,但它更好地平衡了检索任务的效果和效率。04.2. ICL叶片数据集0为了进一步检验所提出的CBW方法在植物叶片识别中的潜在应用能力,使用了另一个名为ICL数据集[3]的公共叶片数据集,该数据集由中国科学院智能机器研究所的智能计算实验室(ICL)建立。该数据集非常大,目前包含来自220个物种的16851个样本,每个物种的样本数量从26到1078个不等。据我们所知,这可能是目前可用于研究的最大数据集。每个物种的一个典型样本如图6所示。图7还展示了示例叶片形状,显示了丰富的类内变化。ICL数据集中的所有叶片都生长在中国,与MEW2012数据集的叶片来自中欧不同。因此,MEW2012数据集和ICL数据集之间存在许多不同的物种。特别地,ICL叶片数据集中包含11个复叶物种,其中包含多个小叶片(见图8的第一行,它们的样本数量分别为63、97、49、69、90、41、48、54、26、62和55)。0图7.ICL叶片数据集中的示例叶片,展示了自然变形和自交的类内变化。 IDSC+DP [9] ~ ~ SC+DP [15] ~ ~ MDM-CD-RM [3] 37.45 3.10 MDM-ID-RA [3] 34.18 3.92 HSC [10] 51.65 0.26 61260图8.所提出的CBW方法和其他三种比较方法在ICL叶片数据集中检索复叶的平均MAP分数(%)。0许多研究[3][25][38]已经在ICL数据集上进行了。然而,他们只选择了部分叶样本(不超过6000个)进行测试,其中一些包括对数据集中的所有叶样本进行去除叶柄的预处理(称为干净的叶样本)。为了保持原始ICL数据集的挑战性,在我们的实验中,所有ICL数据集中的样本都用于测试,没有进行任何预处理。由于基于点的匹配方法IDSC+DP [9]、SC+DP[25]和高度函数[36]的计算成本太高。其中最快的方法也需要超过24天才能完成所有的检索任务(16851次检索)。因此,我们在这个实验中不得不省略它们。剩下的方法的MAP分数总结在表2中。表2.ICL叶片数据集上的MAP分数。0算法 MAP分数(%) 平均检索时间(s)0高度函数 [36] ~ ~0所提出的CBW 55.02 9.630可以观察到,所提出的CBW方法在所有竞争方法中始终保持领先地位。在这个挑战数据集中,所提出的CBW方法的MAP分数为55.02%,比HSC [10]、MDM-CD-RM[3]和MDM-CD-RA[3]方法分别高出3.37%、17.57%和20.84%。我们还关注复叶的检索结果。因此,我们特别展示了图8中所有复叶物种的平均MAP分数,其中每个物种的报告MAP分数是包含的所有样本的MAP分数的平均值。可以观察到,几乎对于所有的复叶物种,所提出的CBW方法在所有竞争方法中都取得了最好的MAP分数,只有对于第六个物种(从左到右在图8中),所提出的方法比MDM-CD-RM[3]方法低不超过1.0%。而在所有竞争方法的所有物种的平均MAP分数上,所提出的方法达到了76.3%的MAP分数,比其他方法高出6.8%、21.3%和33.0%。0HSC [10],MDM-CD-RM [3]和MDM-ID-RA[3]分别表明了所提出方法的出色性能。值得一提的是,所提出的CBW方法在第五个复叶物种相对于其他复叶物种上报告了非常低的MAP分数(不超过40%)。我们检查了ICL数据集,并发现在该物种的所有90个样本中,有46个样本的叶柄被保留,而其他44个样本的叶柄被去除。这种情况确实是一个巨大的挑战,因为严重的遮挡发生了。尽管所提出的方法只达到了37.3%的MAP分数,但仍然比其他方法高出2.7%以上。我们还报告了所提出方法和其他三种比较方法在表2中的检索速度。可以看出,方法HSC[10]的工作速度比所提出的方法和MDM方法的两个版本[3]要快得多,而所提出的方法的检索速度与MDM方法的两个版本[3]的顺序相同。考虑到效果和效率之间的平衡,所提出的方法对于叶片图像检索是可取的。05. 结论0我们提出了一种新颖的方法,称为弦束行走,用于形状描述和匹配.每个弦对行走通过对行走的弦进行形状图像函数的积分来捕捉轮廓特征并反映形状的内在属性.弦束行走用于建立一个分层框架,提供从粗到细的形状描述.它具有以下几个优点: (1)对于包括平移、旋转、缩放和镜像在内的变换群具有不变性;(2) 能够有效识别自重叠的叶片形状; (3)能够精确表征多尺度下的局部形状几何特性,有助于在大的类内变化和小的类间差异下识别叶片形状.在两个具有挑战性的叶片形状图像数据集上,与现有方法相比,具有较高的准确性和较低的计算成本,表明了该方向的研究潜力.0致谢0本研究得到了澳大利亚研究委员会DP140101075号资助和中国国家自然科学基金61372158号资助. 61270参考文献0[1] S.G. Wu, F.S. Bao, E.Y. Xu, Y.-X. Wang, Y.-F. Chang, and Q.-L.Xiang. 一种基于概率神经网络的植物分类叶片识别算法.2007年IEEE国际信号处理与信息技术研讨会论文集. pp. 11-16,2007. [2] A. Khotanzad and Y.H. Hong. Zernike矩不变图像识别.IEEE模式分析与机器智能杂志, 12(5): 250-261, 1990. [3] R. Hu, W.Jia, H. Ling, and D. Huang. 快速植物叶片识别的多尺度距离矩阵.IEEE图像处理杂志, 21(11): 4667-4672, 2012. [4] C.D. Manning, P.Raghavan, and H. Schütze. 信息检索导论. 剑桥大学出版社, 2008.[5] H. Laga, S. Kurtek, A. Srivastava, M. Golzarian, and S.Miklavcic. 一种基于形状的植物叶片分类的Riemann弹性度量.数字图像计算国际会议论文集, pp. 1-7, 2012. [6] S. Mouine, I.Yahiaoui, and A. Verroust-Blondet.一种基于形状的植物叶片分类的多尺度三角形表示方法.第三届ACM国际多媒体检索会议论文集, pp. 127-134, 2013. [7]T.V. Hoang and S. Tabbone. 使用RFM描述符的不变模式识别.模式识别, 45(1): 271-284, 2012. [8] D. Zhang and G. Lu.不同傅里叶方法在图像检索中的研究和评估. 图像与视觉计算, 23(1):33-49, 2005. [9] H. Ling and D.W. Jacobs.使用内部距离进行形状分类. IEEE模式分析与机器智能杂志, 29(2):286-299, 2007. [10] B. Wang and Y. Gao.一种用于快速形状检索的平移、旋转、缩放和镜像不变描述符的分层字符串切割方法. IEEE图像处理杂志, 23(9): 4101-4111, 2014. [11]Y.W. Chen and Y.Q. Chen.使用Radon复合特征的平面形状不变描述和检索. IEEE信号处理杂志,56(10): 4762-4771, 2008. [12] P.-T. Yap, X. Jiang, and A.C. Kot.二维极坐标谐波变换的不变图像表示. IEEE模式分析与机器智能杂志,32(7): 1259-1270, 2010. [13] S. Manay, D. Cremers, B.-W. Hong,A.J. Yezzi and S. Soatto. 形状匹配的积分不变量.IEEE模式分析与机器智能杂志, 28(10): 1602-1617, 2006. [14]M.-P. Dubuisson and A. Jain.一种修改的Hausdorff距离用于对象匹配.第十二届国际模式识别会议论文集, pp. 566-568, 1994. [15] S.Belongie, J. Malik, and J. Puzicha.使用形状上下文的形状匹配和对象识别.IEEE模式分析与机器智能杂志, 24(4): 509-522, 2002. [16] C.Grigorescu and N. Petkov. 用于形状滤波和形状识别的距离集.IEEE图像处理杂志, 12(10): 1274-1286, 2003. [17] N. Alajlan, I.E.Rube, M.S. Kamel and G. Freeman.使用三角形面积表示和动态空间弯曲的形状检索. 模式识别, 40(7):1911-1920, 2007. [18] B. Wang and Y. Gao.结构积分变换与Radon变换: 二维数学工具在不变形状中的应用.IEEE图像处理杂志, 23(9): 4101-4111, 2014.0识别. IEEE Trans. Image Processing, 25(12): 5635- 5648, 2016.[19] N. Kumar, P.N. Belhumeur, A. Biswas, D.W. Jacobs, W.J.Kress, I.C. Lopez, and J.V.B. Soares. Leafsnap:一种用于自动植物物种识别的计算机视觉系统. In Proc. Eur. Conf.Comput. Vis. (ECCV), pp. 502-516, 2012. [20] M. Liu, B.C.Vemuri, S.-I. Amari, and F. Nielsen.使用分层总Bregman软聚类进行形状检索. IEEE Trans. PatternAnalysis and Machine Intell., 34(12): 2407-2419, 2012. [21]C.T. Zahn and R.Z. Roskies. 平面闭合曲线的傅里叶描述符. IEEETrans. Comput. 21(3): 269-281, 1972. [22] Q.M. Tieng andW.W. Boles. 使用小波变换零交叉表示识别2D对象轮廓. IEEE Trans.Pattern Anal. Machine Intell., 19(8): 910-916, 1997. [23] C. Xu,J. Liu, and X. Tang. 通过轮廓灵活性进行2D形状匹配. IEEE Trans.Pattern Anal. Machine Intell., 31(1): 180-186, 2009. [24] T.Adamek and N.E. O'Connor.一种用于非刚性形状的多尺度表示方法,具有单个闭合轮廓. IEEETrans. Circuits and Systems for Video Technology, 14(5):742-753, 2004. [25] B. Wang, D. Brown, Y. Gao, and J. La Salle.MARCH: 用于移动叶片图像检索的多尺度拱高描述符. 信息科学,302: 132-148, 2015. [26] C.-L. Chou, H.-T. Chen, and S.-Y. Lee.基于模式的网络规模视频近似重复检索和定位. IEEE Trans.Multimedia, 17(3): 382-395, 2015. [27] N. Arica and F. Vural.BAS: 一种基于波束角度统计的感知形状描述符. PatternRecognition letters, 24(9-10): 1627-1639, 2003. [28] F. Jananand M. Brady.利用离心率变换图像上的积分不变量进行形状描述和匹配. In J.Comput. Vis., 113(2): 92-112, 2015. [29] S. Tabbone, L.Wendling and J.-P. Salmon. 一种基于Radon变换的新形状描述符.计算机视觉与图像理解, 102(1): 42-51, 2006. [30] X. Wang, B.Xiao, J.-F. Ma, and X.-L. Bi.基于Radon和Fourier-Mellin变换的缩放和旋转不变分析方法用于对象识别. Pattern Recognition, 40(12): 3503-3508, 2007.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功