没有合适的资源?快使用搜索试试~ 我知道了~
基于二阶局部四角模式和颜色特征的图像检索系统
沙特国王大学学报基于四角模式和色矩特征Umer Ali Khan,AliJaved工程技术大学软件工程系,巴基斯坦,塔克西拉47050阿提奇莱因福奥文章历史记录:2021年12月2日收到2022年7月6日修订2022年7月6日接受2022年7月13日在线提供保留字:局部四角模式(LTAPs)纹理特征颜色特征混合特征遗传算法支持向量机A B S T R A C T包括Facebook和Twitter的公共媒体平台的指数增长以及低成本数字捕获设备的可访问性已经产生了大量的包括图像的多媒体内容。有效地处理如此海量的图像集合促进了基于内容的图像检索(CBIR)方法的发展。研究人员已经为CBIR提出了机器学习和基于非学习的技术。然而,在CBIR领域,基于机器学习的方法优于非基于学习的方法。CBIR要求开发可靠的描述符,以从存储库中获得最合适的图像,并更好地解决语义差距问题。为了解决这些问题,我们提出了一种新的二阶局部四角模式(LTAP),以更好地捕捉图像的纹理特征。使用二阶方向导数从0°、45°、90°和135 °的相邻像素计算LTAP。此外,我们提出了一个混合的特征向量,通过级联LTAPs和RGB颜色特征,并使用遗传算法(GA)来选择最好的适当的功能,提高我们的系统的图像检索性能。我们采用我们的混合描述符与GA优化的支持向量机(SVM)的图像分类任务,并使用卡方二次距离测量,以确定查询图像和存储库中的图像之间的相似性。在Corel 1 k、Oxford flower和CIFAR-10三个标准数据集上的实验结果表明了该系统的有效性。版权所有©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍社交媒体平台和经济的数字捕获设备的发展在过去的十年里。对如此庞大的数据进行人工和分析以检索最相关的内容,促使研究人员开发有效的基于内容的图像检索方法( Shrivastava 和 Tyagi ,2014)。已经开发了与基于图像内容的图像检索相关的若干技术(Mansoori等人,2013; Liuand and Yang,2013)。图像检索技术主要分为两大类。第一类是注释-*通讯作者。电子邮件地址:ali. uettaxila.edu.pk(A. Javed)。沙特国王大学负责同行审查制作和主办:Elsevier第二类是基于内容的图像检索(CBIR)。ABIR技术具有一些缺点,人工标注具有主观性,人工图像标注的劳动强度大,难以标注复杂的图像。另一方面,CBIR避免了上述与使用基于注释的关键字的图像检索相关的问题因为CBIR是通过图像的视觉内容来检索图像的。(Lin等人,2011; Hsiao等人, 2010年)。大量的CBIR应用已经被部署在许多领域中,例如监视系统(Robles-Serrano 等 人 , 2021; Hafiane 等 人 , 2006 年 ) , 地 形 信 息 应 用(Kareem Jebur,2021年; Rahman,2006年),遥感探测和传感(Ye等人,2019),建筑设计(Bharadi和Meena,2015),对象识别系统(Zhang等人,2016),医学图像检索系统(Rao和Prasad,2021; Ashraf等人,2020; K.,a.将所述第一k.,n.,&d.将所述第一和第二组数据进行比较,R. d.将所述第一和第二组数据进行比较,2021;Naik等人,2009; Chang等人,基于内容的图像检索方法使用各种特征,例如纹理、形状、颜色或可以从图像提取的任何其他空间数据(Ashraf例如,2020; Shukran等人,2021; Machhour和Nasri,2020;Elalami,2014; Jiang和Kim,2021; Al-Jubouri和H.,2020;吉吉https://doi.org/10.1016/j.jksuci.2022.07.0051319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comU.A. Khan和A. Javed沙特国王大学学报7857和Durairaj,2015; Wang等人,2011; Celebi和Aslandogan,2004;Rahman,2006)。CBIR方法被进一步分为两大类,使用局部和全局图像特征来检索图像(Shrivastava和Tyagi,2014; Shen和Wu,2013; Wanib等人,2013年)的报告。然而,CBIR方法仍然面临着不同的挑战性任务,图像的高级和低级特征的视觉内容之间的语义差距,图像到相关语义类的分类,类不平衡问题,以及存在于语义类内以及不同语义类之间的图像的视觉多样性(Liuand和Yang,2013;Wang等人,2014年; Zou等人,2016; Bian等人, 2017年)。基于内容的图像检索领域的研究者正在广泛地应用机器学习和非学习方法。这些方法适用于在线和离线CBIR架构。在在线CBIR架构中,可以提供任何新的图像以从图像数据集中找到相似的图像,并且因此针对用户查询的图像的计算在很大程度上取决于查询图像与数据集图像的相关性类似地,可以将新图像动态地添加然而,在离线CBIR架构中,查询图像是从存储库中的可用图像集合中获取的因此,离线模型克服了基于在线的方法的局限性。因此,我们也采用离线CBIR架构来评估和报告我们的系统的检索结果(Hameed和Abdulhussain,2021; Bhardwaj* 等人,2020;Kaur和Devendran,2020; Zagoris等人,2021; Saoudi和Jai-Andaloussi,2021; Lonescu和Ralescu,2004; Naik等人,2009;Ballerini,2009)使用非基于学习的方法通过提取不同的低级特征(例如纹理、形状、颜色、空间特征等)来实现CBIR系统。这些方法通过考虑查询图像和数据集图像之间的距离来计算相似度。然而,这些系统的检索性能下降,由于增加的语义差距之间的低和高级别的功能和语义类的数据集的增加。此外,非基于学习的方法的计算为了克服与基于非学习的方法相关的这些问题,CBIR领域的研究人员采用了不同的机器学习技术,这些技术使用了监督的(Fadaei等人,2016; Pourreza和Kourosh,2016;Montazer和Giveki,2015;Ashraf等人,2016; Fakheri等人,2013; Sankar等人,2017)和无监督(Zhu et al.,2017;Chaudhuri等人,2016)方法的协助下,不同的低级别特征描述符的图像分类和检索任务。尽管这些基于机器学习的方法优于非学习方法。然而,这些基于机器学习的方法在计算上更复杂,因为它们是复杂的。非基于学习的CBIR方法。MPEG-7视觉组将特征分为不同的类别,即纹理、颜色和形状来表示数字图像。与纹理、形状等图像特征相比,颜色特征具有很好的稳定性和鲁棒性。它对旋转、平移和缩放变化不敏感。此外,颜色特征计算相对简单。纹理提供了许多类型的图像,包括自然场景,遥感数据和生物医学模态的分析表面特征。它在人类视觉系统中起着重要的识别和解释作用。纹理是必不可少的,并且通过给出关于图像中强度值的空间布置的信息来提供图像的突出视觉表示。真实世界的图像是由不同种类的在图像内具有不同表面图案的物体的图像。图像或整个图像中的对象的表面图案是称为纹理(Yue等人,2011; Chang等人, 2001;Lindsay等人, 2008年)。本文提出了一种融合颜色和纹理特征的有监督机器学习方法,该方法利用遗传算法提高支持向量机的分类性能,并利用卡方二次距离度量来度量查询与数据集图像之间的相似性。在当前的文章中,我们提出了新的二阶局部四角模式(LTAPs)功能,以获得输入图像的纹理特征。我们采用二阶导数而不是一阶导数来进行LTAP提取,因为高阶导数对噪声更敏感(Baochang等人,2010年)。一阶导数特征的图像检索性能低于二阶导数特征。这种性能改进的存在是因为二阶导数特征提取更多的信息作为一阶导数特征的补充。然而,超过二阶的高阶导数不能提供更有效的图像表示,从而降低了图像检索系统的性能。使用二阶方向导数,使用0°、45°、90°和135 °相邻像素计算LTAP。我们提出的方法包括对角像素,以计算新的LTAP方向导数,幅度,以及相对于其相邻像素的中心像素的方向。此外,我们提出了一个融合的特征向量,通过conconcart-nating的LTAP和三色矩特征的图像描述。我们采用遗传算法来选择最合适的功能,提高图像检索性能的建议系统。我们对实现有效的CBIR系统的主要贡献如下:我们提出了一种新的局部四角模式描述符,使用二阶方向导数从输入图像中提取更我们采用基于遗传算法的方法来挑选最相关的特征。我们通过遗传算法(GA)优化多类支持向量机。提出了一种低层纹理和彩色图像特征的融合特征向量,以减少低层和高层图像特征之间的语义鸿沟。在三个标准数据集上进行了广泛的实验,即,Corel 1 K,牛津花,和CIFAR-10显示所提出的系统在当代CBIR技术的功效。2. 文献综述本节介绍了当前流行的最先进的CBIR方法的深入探讨流行的CBIR方法已经为CBIR采用了许多局部和全局特征。局部描述符已被证明在不同条件下比全局描述符更鲁棒,旋转、视点改变、缩放等。相反,全局描述符比局部描述符具有更少的计算成本。我们将文献综述部分分为基于计算机视觉的方法和基于AI的方法。2.1. 计算机视觉方法现有方法已经使用了不同的低级特征,即,颜色、形状、纹理、空间布局,兴趣点特征,即,SIFT、SURF、HOG、FAST、Harris边缘检测器和二进制特征,即,BRISK和FREAK(Brisf等人,2019;Iakovidou等人,2019年)。Liu等人(Liu等人,2011)使用颜色和边缘方向功能,●●●●●U.A. Khan和A. Javed沙特国王大学学报7858计算微观结构描述符(MSD),但这种方法缺乏捕获不同对象之间的关系。夏等(Xia等,2016年)提出了一种基于云的模型,使用水印技术来保护用户的图像隐私。所采用的水印技术无法处理几何特征的畸变 。 在 ( Ali 等 人 , 2016;ElAlami , 2011; Lin 等 人 , 2009 ) 采 用YCbCr和HSV颜色空间提取颜色特征,SIFT提取显著点特征,利用边缘像素方向提取空间布局特征,并采用人工神经网络(ANN)和支持向量机(SVM)进行分类和图像检索。现有的CBIR方法(Irtaza等人,2018; Irtaza等人,2014;Latha和Raj,2019; Zang等人,2018; Scott 等人,2017; Wei 和Wang ,2019; Youssef,2012; Rao等人,2011; Wang等人,2001;Chen等人,2005)已经采用各种混合特征向量来检索图像。 颜色和纹理的特征融合与GA一起使用以优化类别不平衡问题(Irtaza等人,2018;Irtaza等人,2014; Latha和Raj,2019)。使用对象模型(OM)来采用高级图像描绘,但是该方法受到维数灾难问题的影响(Zang等人,2018年)。Youssef等人(Youssef,2012)通过基于区域的矢量码本子带聚类(RBSC)和曲波变换的融合提取颜色和纹理特征。Rao等人 (Rao等人, 2011)使用了融合特征描述符,其包括灰度共生矩阵(GLCM)以提取纹理特征,边缘梯度向量以提取形状特征,以及SIFT和SURF描述符以提取视觉特征。SIFT和SURF描述符代表图像检索一旦采用支持向量机导致过拟合。Wang 等人(Wang等人,2001)通过小波变换进行语义分类和基于区域的匹配来匹配图像,但是该方法也存在纹理分类不精确的问题。Chen等人(Chen等人,2005)提出了一种基于聚类的无监督方法来处理不确定的纹理建模问题,并取得了与(Wang et al.,2001年),但是,无法获得准确的分割集群。现有的CBIR方法(Song等人,2014; Ashraf等人,二〇一四年Huang 和 Dai , 2003 年 ; Mehmood 等 人 , 2018; Jhanwar 等 人 ,2004;Tian等人,2014; Zeng等人,2016年)已经广泛使用视觉词模型袋(BoVWM)进行图像检索,对象识别和图像注释任务。BoVWM利用图像特征构造视觉词汇,并开发了视觉词汇库。计算该视觉单词库或视觉单词包的直方图以找到与用户查询图像相似的图像。然而,包视觉词模型的研究也面临着不同的问题,例如这些模型忽略了空间信息并且缺乏语义意义(Song等人,2014; Ashraf等人,2014年)。在(Lin等人,2011; Ashraf等人,2020; Elalami,2014),使用边缘方向直方图和颜色SIFT特征来开发码本以检索和分类图像。在(Khan等人,2021),小波变换和颜色特征与SVM,人工神经网络和Gabor滤波器用于分类和检索图像。自适应搜索、区域匹配、纹理特征和主题共现与SVM和视觉词袋模型一起用于对图像进行分类和检索(Huang和Dai , 2003; Mehmood 等 人 , 2018; Jhanwar 等 人 , 2004 年 ) 。SIFT、局部二进制特征和曲波变换用于提取特征,而最高优先级和k近邻的最相似原则用于图像分类和检索(Tian等人,2014; Zeng等人,2016年)。2.2. 基于AI的方法现有的CBIR方法(Scott等人,2017; Wei和Wang,2019; Shi等人,2018; Alzubi等人,2017年; Guo等人,(2010)广泛采用各种基于深度学习的方法,使用卷积神经网络(CNN)进行图像检索。散列算法用于特征提取,并且提出了成对矩阵模型,其使用深度学习框架来制定目标函数以学习用于图像分类和检索的二进制图像表示(Shi等人, 2018年)。这种基于散列算法的方法通过添加在线和离线学习方法得到进一步在离线学习阶段,提取图像的视觉和纹理特征来表示图像. 离线学习阶段使用静态数据集,而在线学习阶段连续使用更新的数据集(Alzubi等人,2017年)。两个并行的无监督的基于CNN的模型被用来提取特征。 该模型提高了图像检索性能并减少了图像检索时间,因为该方法使用不同的量化级别来减少图像特征表示(Guo等人,2010年)。这些基于深度学习的CBIR方法已经显示出CBIR的显著性能,但是由于复杂的训练过程和大量的训练时间而受到影响(Scott等人,2017; Wei和Wang,2019)。现 有 的 CBIR 方 法 ( Tao 等 人 , 2006 年 ; Lai 和 Chen , 2011年;Saadatmand-Tarzjan和Moghran,2007年; Irtaza等人,2015年)已经采用了各种相关反馈(RF)方法与遗传算法,进化计算,并融合纹理和颜色特征的图像检索和分类任务。然而,基于RF的方法无法得到用户的支持,由于用户参与的图像检索过程。此外,基于相关反馈的方法在计算上更耗时,因为这些方法采用迭代方法并且需要多次迭代来改善结果。随着迭代的增加,用户反馈也增加,以获得与查询图像相似的所需图像。因此,基于内容的图像检索方法,工作自主的基础上,用户查询的图像越来越受到研究人员的欢迎。流行的CBIR方法有一定的局限性,如类内相似性,高级别和低级别特征之间的差距,以及缺乏特征wdb“nothing”:ttagdel“_run.sc”:wdbmethodology在本节中,我们将讨论所提出的CBIR方法。我们提取的纹理特征,使用我们的新的LTAP和RGB颜色功能,使用前三个低阶颜色矩。然后,我们通过连接纹理和颜色特征来获得融合特征向量。我们使用遗传算法优化这个融合的特征向量,选择最合适的特征,并用它们来训练SVM进行图像分类。我们使用卡方二次距离度量来计算数据集图像和查询图像之间的相似性。图1显示了我们提出的方法的架构。在我们提出的方法中,我们采用离线CBIR架构,并使用来自预存储的标准化图像数据集的所有图像,这些图像没有任何噪声。因此,我们不需要对图像进行任何滤波或预处理来提取特征。然而,我们应用最小3.1.特征提取为了开发一种鲁棒的CBIR方法,可以提供更好的检索,为了评估多个图像库的性能,我们需要开发一个有效的特征描述符。在这项工作中,我们提出融合特征描述符,包括我们的新的LTAP功能和三色矩能够有效地表示输入图像CBIR。特征提取过程的细节在后续部分中给出。3.1.1. 当地的四角模式功能。在这项工作中,我们提出了一种新的描述符LTAPs从输入图像中提取纹理特征。LTAP使用以下方式呈现纹理空间结构:U.A. Khan和A. Javed沙特国王大学学报7859P.好吧ΣðÞð Þð ÞðÞ◦◦◦◦04590135XDir我0◦我45◦我90◦我135◦我0◦O4O;ði Þ ¼P.0◦ð2004年。5◦ð萨沃普90◦ðÞ13 5◦ðÞΣΣFig. 1. 提出的基于内容的图像检索方法的架构图。中心灰度像素Zo的方向。为了计算LTAP,我们计算0°、45°、90°和1;I0Z i; I0Z iP0和I0Z i; I0Z iP0:I0Z2;PI0Z;I0P.Z.Z.Z.0<和P.I0Z135°围绕中心像素Zo的相邻像素。公司现采用国际用于特征提取的二阶导数,因为二阶导数比一阶导数从图像计算更详细的辨别特征。此外,高阶3;I0Z i; I0Z i<0和I0Z i; I0Z i<第0章:4;P.I00Zi;I045ZiP0和P.I090Zi;I0135Zi0:ð5Þ超过二阶的导数对噪声更敏感(Baochang等人, 2010),并降低图像检索系统的性能。为了计算在0°、45°、90 °和135 °方向上的二阶导数,首先我们需要计算围绕中心像素Z o的在0°、45°、90 °和135 °方向上的一阶导数。中心像素Zo周围的图像I(Z)在0°、45°、90°和135 °方向上的一阶导数可以表示为I(Z),其中h = 0°、45°、90 °和135°。设Zo为图像中的中心像素当量(5)示出了中心像素的可能方向是1、2、3或4,并且最终图像转换为四个值或四个方向。而二阶方向导数LTAPs00(Zo)计算如下:LTAPs00 Zo¼。F.I0Dir Zo;I0Dir Z1;f.I0Dir Zo;I0Dir Z2。 . . F.I0DirZo;I0DirZið6Þ其中i = 1,2,3.. . 8.I(Z).其中Zi显示中心像素Zo且i = 1,2,3,.. . ,8表示八个立即数F.I0方向ZoZ i如果I0方向ZoZiZi相邻像素如图所示。 二、围绕中心像素在0°、45°、90°和135°处的四个一阶导数计算如下:I0ZIZ--IZ1从等式(6)和(7)中,我们获得了每个中心像素的8位tetra模式这样,我们得到四个不同的模式,然后每个模式被转换为三个8位二进制模式。因此,我们总共得到12个(4 × 3)二进制模式。假设中央I0 Z在三个二进制模式中计算如下:45◦O3O8I090ZoZ2--IZo3LTAPs00jDirection<$2;3;4<$IZo×fLTAPs00Zij1/1方向1/2; 3; 4ð8ÞI0135ZoZ1--IZo4此外,中心像素Z相对于其. 1,如果LTAP00ZU0相邻像素计算如下:方向¼U0;否则像素方向I=Dir(Zo),由等式(7)是LTAPs00j¼ð9ÞU.A. Khan和A. Javed沙特国王大学学报78608×¼ð Þ¼M×NMP¼XIZo×f. MI0Zi-MI0Zo111/1MI0Z i-MI0 Zo1;如果 MI0Zi>MI0Zo0;否则ð12Þ图二. 围绕中心像素Zo的八个相邻像素的布置。使用等式(5)计算中心像素的方向,并进一步用于计算TETRA模式比特。图 3演示了tetra模式位的计算。在识别出12个纹理二进制模式和第13个纹理幅度模式的二进制模式(BPs)之后,我们使用等式(1)计算纹理二进制模式(TBP)和纹理幅度模式(TMP)的直方图(十四)、我们通过TBP和TMP直方图的级联来获得纹理特征向量[TFV],如等式(1)所示。(17).M N其中U= 2,3,4。与Eqs中的相同在(8)和(9)中,计算方向2、3和4的二进制图案,并将灰度值分配给相应的像素。Guo等人(Corel 1K数据集,可在公司简介1 X XfBP Si; j;l131/1第1页其中,1s½0;ss-1s2]是最大LBP模式值,MN表示输入图像x的大小LBP S i;j,yL并且函数f被定义为:http://wang. ist.psu.edu/docs/related/,2021年6月5日访问)在他们的工作中使用幅度分量提出了幅度局部二进制模式(LBP),并证明幅度fx;y1;x¼y0;否则ð14Þ组件计算更有用的信息。因此,我们还将第13个二进制模式计算为围绕中心像素的0°、45°、90 °和135 °处的一阶导数的幅度模式(MP),如下所示:M0¼qI0Z2I0Z2 I0Z2图图3示出了如果中央和中央处理器被配置为“0”,则LTAP比特被编码为“0”。相邻像素具有相同的方向。如果中心像素和相邻像素的方向不同,则该比特被编码为相邻像素的方向。使用相同的方法,计算具有方向的中心像素的LTAP位2,3,和4,如图所示。3.第三章。我爱你0◦我的天45V我的天þ ð90◦我的天þð135◦我的天ð10Þ二阶LTAP计算的一个例子如图所示。 4,其中中心像素标记有红色,图3.第三章。计算具有方向“1、2、3和4”的中心像素的局部四角模式(LTAP)比特红色箭头表示中心像素的方向,蓝色箭头表示相邻像素的方向。..U.A. Khan和A. Javed沙特国王大学学报7861P.Σj¼ðÞ×ð联系我们.ðÞ¼¼¼.ð ÞðÞ¼P.P.Þ×Nf = x; y = 1/2。0¼[1/2jj]8><1;P. I00 Zi、I45ZiP0和PP。.I090Zi;I0135ZiP0:9>=½ð - [2019 - 04 - 21 ]Þ¼我I0DirZi;Else:阿吉什◦ÞÞþ ð◦ÞÞþð◦ÞÞþð◦ÞÞ方向我们使用等式计算用蓝色标记的所有八个(五)、然后,我们使用等式计算二阶LTAP。(六)、在图4中我们可以看到,当中心像素的方向与其相邻像素的方向不同时,LTAP用相邻像素的方向编码,并且当中心像素的方向与其相邻像素的方向相同时,LTAP用“0”编码在计算LTAP之后,每个模式在所有方向上被编码为三个二进制模式为了计算方向“2”上的二进制模式类似地,针对其他方向计算二进制模式,即, 为了计算幅值模式,使用以下等式比较中心像素及其相邻像素的幅值(十二)、当中心像素的幅值小于其相邻像素的幅值时,幅值模式用位“1”编码,而当中心像素的幅值大于其相邻像素的幅值时,幅值模式在算法1中给出了使用LTAP的纹理特征提取过程我们提出的特征提取方法是免费的,从任何几何变换的像素,因为我们总是计算导数在四个固定的方向从中心像素。此外,考虑到均匀模式对噪声不太敏感的事实,我们通过为每个单位定义一个单一的bin来计算LTAP形成图案和一个箱用于所有非均匀图案。这使得我们的LTAP功能强大的噪声和几何变换,同时表示检索目的的图像。因此,我们认为,所提出的LTAP功能可以可靠地用于捕捉的独特特征,从输入图像,即使在存在噪声和几何变换。算法1基于LTAPs的灰度图像纹理特征提取过程。3.1.2. 色彩时刻特征。我们还提取了颜色矩特征,以进一步提高CBIR的LTAP的性能。为此,我们采用均值、标准差和偏度(前3个低阶颜色矩)来获得RGB图像的颜色特征。总体而言,9色矩计算,puted为红色,绿色和蓝色通道的每个RGB图像。在算法2中提供了从输入RGB图像中提取颜色矩特征的过程。3.1.3. 混合特征向量。在提取了LTAP和颜色矩特征之后,我们通过以下方式对特征描述符进行了归一化:最小-最大归一化方案,以在0到1的范围内缩放两个特征描述符的值。然后将纹理特征向量(TFV)和颜色特征向量(CFV)拼接得到混合特征向量(HFV)。HFV的维数开始输入:f(x,y):灰度图像输出:TFV(纹理特征向量)对于图像数据集中的每个图像1. 计算一阶导数:I=I(Z)霍伊奥其中i = 1,2,3。. . 8和h= 0o,45o,90o和135o2. 计算中心像素Zi的方向,其中i = 0I(Z)=2;P. I000Zi、I045Zi<0和P. I090Zi;I0135ZiP0:迪尔一世>3;P. I00Zi、I45Zi<0和P.I090Zi;I1035Zi0:>:4;I00Zi;I045Zi P0和I09 0μmZi0;I0135μmZi<0:;3. 计算2阶方向导数模式(LTAP)LTAP00(Zo)= {f(I=Dir(Zo),I=Dir(Z1)),f(I=Dir(Zo),I=Dir(Z2)).. . f(IDir(Zo),IDir(Zi))}F. I0DirZo;I0DirZ。0;ifI0DirZoI0DirZi4. LTAP被转换成二进制模式,其中中心像素的方向I=Dir(Zo)= 1:8LTAPs00方向2; 3; 4I ZofLTAP00Zi方向二、三、四1/ 1LTAPs00j方向¼U1个;如果LTAPs00Z iU0;否则其中U2; 3; 45. 计算幅度模式(MP):MI0Z<$qI00Zi2I045Zi2I090Zi2I0135Zi8MP¼iP¼1我爱你 ×f.MI0Zi-MI0ZoMI0Zi-MI0Zo1;如果MI0Zi >MI0 ZO0;否则6. TFV通过直方图计算如下:MNH-S-L-L-M1FLBP S i;j; l联系我们其中l为0;s为s是最大LBP模式值,MN表示输入图像的大小,xLBP Si,j,y l,并且函数f被定义为:1;x y;否则TFV HistTBP HistMBP首尾互掉U.A. Khan和A. Javed沙特国王大学学报7862×××7 677 67b b b b bb776667C67C7一一一一一BBB6:7–P* ={U}。虽然(大小)Sizeof(IP))。12667CCCCCCCC676721是[11288],用于每个语义类,包括100个不同的图像。而对于Corel图像数据集,语义类的每个图像的TFV的维度为[1 1024],语义类的每个图像的CFV的维度为[1 264]。混合特征向量表示如下,其中我们采用遗传优化的SVM来分类和检索与查询图像非常相似的图像。遗传算法为SVM提供最佳的特征组合进行训练。遗传算法使用在等式中给出的适应度函数。(13)分析父特征和子特征之间的距离和标准偏差,并向特征提供2 3 26 7 6b b b最小距离和标准偏差到SVM用于训练目的。算法3给出了通过GA选择最佳特征的过程。7100;1 1;2 2019- 01 - 2101:01:011; 1024磅100;1 1;2 1;3 2019- 01 - 26 01:21:260的情况。 vu。12; 1024b2;1b2;2b2; 3b2; 4:b2; 264F最小直径下的最小标准偏差utXp-ci2X.p-cj=2. 一63; 1024年7月6日3; 1日 103;2 103;3 2019 - 03- 24 00:264人我.1/1我j/2。JJ66 7 6ð16Þ算法3选择最佳孩子作为支持向量机的输入。:tor使用GA的机器。74分;1分2.0g; 2 g100;3n;41024年5月4日26100万;1万2.0g;2 g 100;3 n;4中国; 26437开始.输入IP:初始群体,Pc:群体染色体。CFV:颜色特征向量,TFV:纹理特征向量。N:基因数量,M:群体大小,r:标准6 72019 -01- 22 00:01:01:01:02:02:02:0c2; 1c 2;2c 2; 3c 2; 4:c 2; 1288偏差输出GP:生成的人口。其中:j e {1,2.. . N}和k e {1,2. N}。B半TFV]½CFV]BBB3:¼aaab b2;abc 3;a1a2;1a 3;a2a2;2a 3;一3a 2; 43 a 3; 4:*a股*a股*a股::U.A. Khan和A. Javed沙特国王大学学报786352CCCCC我NNIJri¼1NN伊杰河 -E iSVM =IP。端2019 -03-2200:03: 1288六点七分Pc=[ai,1,ai,2,a一、3... 一4U.A. Khan和A. Javed沙特国王大学学报7864i,N],其中:ie{1,2. M}。:选择:p,p从IPU.A. Khan和A. Javed沙特国王大学学报7865¼ kk100万;1万 2.0g; 2 g 100;3 n;4半HFV]U.A. Khan和A. Javed沙特国王大学学报7866I¼NNij-我的算法2 RGB颜色特征提取过程图像使用颜色矩。U.A. Khan和A. Javed沙特国王大学学报7867开始.输入:RGB图像,p ij :输入图像的R、G、B分量。输出:CFV(颜色特征向量)。1.Ei:平均值,ri:标准差,si:偏度。对于图像数据集中的每个图像段时间第1页交叉:p1,p2得到h1,h2.U.A. Khan和A. Javed沙特国王大学学报7868N}.突变:if(h1 ==h2)得到c1,c2。否则c1 = h1 c2 = h2.U.A. Khan和A. Javed沙特国王大学学报7869如果(Chi_dis(p1,c1)+Chi_dis(p2,c2)≤Chi_dis(p1,c2)+Chi_disU.A. Khan和A. Javed沙特国王大学学报7870(p2,c1))。{.U.A. Khan和A. Javed沙特国王大学学报7871如果(r(c1)r(p1)),则GP=GP U{c1},否则GP=GPU{p1}。U.A. Khan和A. Javed沙特国王大学学报7872如果(r(c2)r(p2)),则GP=GP U{c2},否则GP=GPU{p2}。U.A. Khan和A. Javed沙特国王大学学报7873}.别的U.A. Khan和A. Javed沙特国王大学学报7874{.如果(r(c1)r(p2)),则GP=GP U{c1},否则GP = GPU.A. Khan和A. Javed沙特国王大学学报7875U{p2}。如果(r(c)r(p)),则GP=GP U{c} elseGP =GP U{p}。2.E¼1Pp
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功