没有合适的资源?快使用搜索试试~ 我知道了~
埃及信息学杂志19(2018)83全文基于特征颜色特征和集成机器学习的S.A. Oyewole,O.O.奥卢巴拉信息和通信技术与社会研究小组,德班科技大学,P.O.南非德班,南非阿提奇莱因福奥文章历史记录:2016年9月11日收到2017年6月30日修订2017年10月23日接受2017年11月1日上线保留字:电子商务特征向量包络神经网络支持向量A B S T R A C T在过去几年中,电子商务产品的过多已经成为购物者在搜索相关产品信息时的严重挑战。因此,这导致了推荐助理技术的出现,该推荐助理技术具有发现满足用户偏好分类是一种机器学习技术,可以帮助创建动态用户配置文件,提高可扩展性并最终提高推荐准确性。然而,异构性,有限的内容分析和高维的电子商务数据集,使产品分类的一个困难的问题。在本研究中,我们提出了一个增强的产品图像分类架构,它具有数据采集预处理,特征提取,降维和集成的机器学习方法作为组件。这些组件中的核心是基于特征向量的融合算法,该算法旨在从基于方向梯度的彩色图像代表特征的直方图中获得降维的本征颜色特征。利用特征颜色特征对人工神经网络和支持向量机的集成进行训练,对PI100语料库中的产品图像进行100类分类,并比较了它们的分类精度。我们已经获得了一个国家的最先进的分类准确率为87.2%的arti-神经网络集成,这是一个令人印象深刻的结果相比,现有的结果报告的其他作者谁利用了PI 100语料库。©2017制作和主办由Elsevier B.V.代表开罗计算机和信息学院大学这是一篇CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍现代电子商务的采用为商家带来了更高的盈利能力,并为消费者带来了更多的满意度[1这也通过改善国内生产总值(GDP)对世界各国的经济产生了积极影响。普华永道(PwC)在南非的报告称,用户在线零售购物销售额历史上首次超过1万亿兰特(南非货币),2016年已增至1.46万亿兰特[5]。此外,同*通讯作者。电 子 邮 件 地 址 : 21242711@DUT4life.ac.za ( S.A.Oyewole ) ,oludayoo@dut.ac.za(O.O.Olugbara)。开罗大学计算机和信息系负责同行审查。据报道,由于全球电子商务的激增,非洲大陆的集体国内生产总值预计将由美国到2020年将达到1万亿美元,高于2010年的1.6万亿美元。此外,经济学人智库(EIU)预测,2012年至2016年非洲大陆的实际GDP增长率为4.9%,远高于全球平均增长率[5,6]。电子商务在全球经济增长中发挥着关键作用,保持客户满意度的必要性不容忽视。然而,近年来,丰富的电子商务信息已经成为一个严重的挑战,购物者,因为在信息发现的固有困难。这导致了推荐系统的出现,以帮助用户的信息发现。基于内容的图像推荐系统是一种应用程序,它使用图像特征来过滤所有可用来源的信息,并根据保存在用户配置文件中的个人偏好显示适当的信息[7,8]。推荐系统的起源可以追溯到认知科学、管理科学、近似理论和信息检索中的方法,这些方法已经被应用于各种人类努力中。https://doi.org/10.1016/j.eij.2017.10.0021110-8665/©2017制作和主办Elsevier B. V.代表开罗大学计算机和信息学院这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表埃及信息学杂志杂志主页:www.sciencedirect.com84S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)83在电子商务应用领域中,许多方法和原理被应用于实现推荐系统,其中分类方法被认为是推荐系统的一个重要组成部分。产品分类是基于内容的推荐系统最重要的处理任务之一,它涉及到大量商家的类别与相关产品的关联。除了用户分析[9,10]之外,分类方法在许多推荐应用中也很有用,例如产品图像检索[11[15] 并提高整体推荐准确性。同时,产品分类研究中报告的大多数准确性严重依赖于文本标记,这是一种传统的产品数据表示方法[16然而,基于文本标记的产品分类受到几个问题的困扰,例如产品类别中的重叠文本[19,20],劳动密集度[21],词汇使用的差异[22],拼写错误[23]和文本的非描述性[20,24]。虽然可以通过尝试利用文本特征的新方法来实现越来越多的改进[19,21],但目前的研究工作已经将重点转移到基于图像的产品分类模型,这些模型在生活的各个领域中具有不同的应用[24根据模式识别理论,特征提取和特征识别方法在分类过程中起着重要的作用由于准确性是性能的常见评估之一,推荐领域的一些研究人员进行了有趣的研究,以提高产品分类的性能。与文本标记相比,基于图像的产品分类涉及使用图像进行产品表示和分类模型。提取图像特征的高维性、有限的内容分析、伪影、不均匀性和其他细微差别因素通常抑制基于图像的分类性能[10,16,27]。大量的研究已经朝着这个方向,然而,调查的图像类的数量和准确性报告仍然有很多需要实时应用。在承认这些问题的复杂性,初步尝试解决一个更简单的子问题的图像内容为基础的分类,提出了增强的产品图像分类架构。在所提出的架构中使用的核心算法提出的架构是用来分类产品图像到100类。具体来说,这项工作的努力是朝着实现一个有效的基于图像的分类模型,主要依赖于人工神经网络(ANN)和潜在的集成有效的基于特征的图像特征表示。采用方向梯度直方图(HOG)和均匀线性二值模式(ULBP)特征提取方法从产品图像中提取彩色产品特征。然后应用基于特征的算法提取降维的产品图像特征.我们应用了数据分区(交叉验证)方案,将初始数据以70%:15%:15%的比例分为训练,验证和测试子集(70%的数据集用于训练网络,而其余数据集的15%用于验证和测试),在PI100分类数据集上进行了实验探索[28]。我们选择这个数据库是因为它已被广泛用于电子商务研究中的产品图像分类[25,26,29,30],它是免费提供的研究目的。本研究的首要目标是生成一个高效的基于图像的分类模型,该模型可用于提供有效的以用户为中心的分类偏好,或与任何传统的推荐系统集成,提高其质量。在实现这一单一目标,四个不同的- ent实验进行了建立适当的产品图像分类模型的建议架构。本文的主要贡献如下:(1). 提出了一种基于特征的产品图像特征提取算法,为大类产品提供了有效的产品图像表示。该方法的结果可以作为一种图像分割方法在电子商务应用,如推荐系统,以解决固有的有限的内容分析问题。(2). 最终的分类模型可以很容易地与电子商务领域的任何其他决策支持应用程序集成,以提高其质量。(3). 建议基于特征的产品图像特征提取算法进行定量评估的实验图像从公开的产品图像使用标准的准确性和均方误差度量。这项工作进一步强调了这样一个事实,即机器学习分类器的集成比孤立使用的任何分类器都能给出更好的结果。本文其余部分的结构如下。在第2节中,讨论了相关文献。第3节详细描述了我们提出的架构以及材料和方法。然后,我们描述了实验进行验证的性能第4节中产品图像分类任务的各种方法。第5节讨论了结果。最后在第6节中对未来的发展方向进行了简要的讨论。2. 文献综述图像特征提取和分类方法是识别过程中的两个重要任务。人工神经网络(ANN)和支持向量机(SVM)是两种流行的分类器,它们已被应用于电子商务产品图像分类和决策支持任务,并取得了一定程度的成功。具体地,ANN具有对用户简档中的一组输入变量与用户的对应偏好之间的非线性关系进行建模的能力。当人工神经网络与任何电子商务应用程序(如推荐系统)集成时,大量的产品数据通常会导致过拟合[31,32]。为了克服这种过拟合问题,交叉验证被认为是确保不发生过拟合的最有效方法之一[31,32]。在这里,可用的数据通常分为三组,分别是训练、测试和验证。训练集用于调整连接权重,测试集用于检查网络在各个学习阶段的性能,一旦测试集中的错误增加,则停止训练。一旦成功完成训练,验证集用于评估模型的性能[32]。这种基于分区的交叉验证可以在推荐系统中使用时间,项目评级(可以以数字或产品项目特征表示的用户偏好的形式出现),分类和用户分层来完成[31,33]。许多作者有集成ANN分类器与图像基于内容的方法来提高产品图像识别。在Bonnet[34]中,使用卷积神经网络(深度学习)和自然语言处理(NLP)的组合开发了电子商务产品的对象识别管道。在他的工作85%,86%和86%的分类精度实现S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)8385具有图像、文本和两者的混合,分别为10个类。研究人员最终通过使用迁移学习和神经网络微调实现了94%的分类准确率。然而,所考虑的10个类别的数量仍然非常有限。其他研究人员[31,32,34,35]采用了各种交叉验证技术来解决过拟合问题,以提高分类精度和用户偏好的预测在[35]中,提出了一种新的交叉验证技术来评估推荐系统的质量。除了将初始数据划分为训练和测试子集之外,他们的工作还将数据集的属性描述划分为隐藏和可见部分。新的交叉验证是在传统的基于用户和基于项目的推荐算法上进行的,这些算法应用于Movie Lens数据集。类似地,Berka等人[36]使用ANN构建了用于网络导航的URL推荐系统。他们实现了一个内容独立的系统,该系统完全基于路径为了有效地做到这一点,他们使用了前馈多层感知器,并使用了反向传播算法进行训练在Hsu et al.[37],人工神经网络被用来组合来自多个推荐模块或数据源的输入。具体而言,研究人员通过从四个不同的来源,即用户档案和刻板印象,观看社区,节目元数据和观看上下文导入数据来构建电视他们使用反向传播算法来训练一个三层神经网络。在同一观点中,Christakou和Stafylopatis[38]构建了一个混合的基于内容的协作过滤推荐系统。基于内容的推荐器是每个用户使用三个神经网络来实现的,每个神经网络对应于以下特征之一:他们使用弹性反向传播方法训练人工神经网络Vassiliou等人。[39]提出了一种方法,该方法使用ANN识别用户配置文件和感兴趣的项目之间的隐式模式,然后通过协作过滤进一步增强以个性化建议。为了进一步提高基于图像的产品分类准确性,在这方面,许多研究人员已经研究了将多个分类器的预测组合起来的技术,这被称为集成学习[40]。据报道,包围学习在许多应用领域都是有效的,例如面部表情识别[41],生物信息学[42,43],高光谱图像处理[44],大文本语料库和对象检测[45]。实验结果表明,集成学习的使用往往比任何单独的分类器产生更好的性能。推荐系统中的一个明确例子是[46]中的工作,其中集成学习方法用于音乐推荐。此外,Freund et al.[47]提出了一种名为RankBoost的算法,结合用户偏好,在协作过滤设置中产生电影推荐。同样,许多研究人员已经使用SVM分类器来实现基于图像的分类。在[29]中,作者使用支持向量机(SVM)和视觉词分类器包的图像标记技术,对2-3类问题实现了66%至98%的分类准确率。Jia等人[24]使用Tomasik等人[29]的相同2Jia等人。[48]提出了一种自动快速在线产品分类算法,具有类别特定描述符和SVM。作者报告了30个产品类别的准确率为84%。Zhang和Sha[25]采用SVM分类器结合从PI100数据集提取的Pyramid Histograms of Oriented Concentrations(PHOG)特征来实现产品图像分类。他们报告的平均准确率为74.5%和94.5%,5此外,Jia et al.[24]将两个直接SVM和两层SVM叠加在94个类上,分别报告了81.2%和79.1%的总体准确率使用相同的数据集,Oyewole等人。[26]提出了一种基于图像的产品分类策略,该策略利用多核学习(MKL)将五种不同颜色模型中的产品图像自动研究结果表明,提出的MKL-LaRBF分类器的平均分类准确率为83.5%,始终然而,该架构依赖于HOG的243向量大小的大特征维度在Jia etal.[49],提出了基分类器的组合,该组合使用互补特征进行训练。根据作者的说法,结合分类器将整体准确率提高到86.9%,这被称为最先进的分类准确率。Jia等人[50]提出了一种基于两层SVM分类器产品图像自动他们在PI100公共产品数据集上实现了83.4%的精确度,比他们早期的工作略有提高[51]。显然,上述研究工作中的一些已经导致产品分类方法的性能的显著然而,审查的研究(除[26,49,51]外)考虑的产品类别数量有限一般来说,文献中报道的基于图像的产品分类的准确性仍然有很多需要改进的地方。因此,本研究的灵感来自于迫切需要开发一个更精细和准确的基于图像的产品分类模型,可以与推荐系统集成,以提高其质量。3. 材料和方法所提出的基于图像的产品分类体系结构如图1所示,它是Oyewole等人提出的体系结构的扩展。[26]第10段。扩展以前的架构的动机是需要通过特征降维来降低其复杂性,并通过分类器的集合来提高分类精度如图1所示的建议架构的组件在本节中进行了详尽的描述。3.1. 数据集如图1所示,所提出的架构中的第一个块涉及实验数据集的获取,例如PI100语料库[28]。该语料库包含电子商务产品的一万张低分辨率彩色图像,这些图像被分为100节课。每个图像都包含相对稳定形式的主要对象,这正是产品图像 通 常 出 现 在 电 子 商 务 网 站 上 的 方 式 , 例 如 Amazon.com ,Jumia.com , eBay , Web.com 和 Volkswagen 。 图图2 显 示了从PI100数据集中的10个类中选择的80个样本图像。这些类是婴儿鞋,夹克,营养,牛仔帽,耳环,花,可以,头盔,登山背包和公文包。每个类别中的物品在形状和外观上相似,但在颜色内容上变化不大。然而,不同类别的产品图像在其形状和语义特征的大小方面存在很大差异。考虑到需要避免可能发生的维数灾难在每个图像类的实例数量稀疏的情况下,我们为语料库中的100个类中的每一个类收集了20个图像样本,最终得到2000个电子商务产品的彩色图像。86S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)83Fig. 1.增强的基于图像的产品分类架构。图二.从PI100数据集中选择产品图像。T R A I N I NG数据集预处理特征提取产品分类产品图像训练数据集(PI 100语料库)调整大彩色图像描述符(cHOG和cULBP)- 定制分级机- 单分类器- 分级机噪声滤波(中值滤分类测试产品图片降维(本征颜色特征)分类输出T e s t I n gCHAN NNEL3CHAN NNEL2C h a n n e l 1S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)8387×X1½;]¼ ;;x××××××××; ;3.2. 预处理在图1中提出的架构中的第二块中所示的图像预处理是在计算处理之前增强图像的技术。在大多数图像分析中,预处理模块通常形成图像采集后的第一步[52]。该处理将输入图像变换成基本上类似于输入图像但在某些方面可能不同的新图像。预处理操作的示例包括去噪、掩蔽、分割、归一化、反射去除和噪声去除。在这项工作中,应用于选定的产品图像的预处理操作是图像去噪和噪声过滤。为了实现图像缩放,将所有图像的大小标准化为300 300像素。为了从产品图像中获得平滑的输出,调整大小的图像必须经过过滤过程。这个过滤阶段是非常必要的,因为许多图像为基础的问题,lems受到噪声的严重影响。如果图像像素的值与其邻近区域的其他值相差很大,则该图像像素被认为是有噪声的[52]。未能对噪声数据采取具体措施可能导致分类性能不佳[53在本研究中,我们通过对每个节点应用一种称为中值滤波器的现有方法来实现所提出架构的噪声滤波。彩色图像的三个通道分别[52,56,57]。3.3. 特征提取图1中的第三块包含所提出的架构的特征提取组件。产品图像分类的准确性在很大程度上取决于所提取特征的区分能力。事实上,如果使用较差的特征,最好的分类器可能无法实现准确的识别[58]。在数字图像处理中,颜色、形状和纹理是产品描述的重要原始特征。文献中针对该原始特征的现有特征提取算法包括尺度不变特征变换(SIFT)[59]、加速鲁棒特征(SURF)[60]、定向梯度直方图(HOG)[61]、局部二进制模式(LBP)[62,63]、二进制统计图像特征(BSIF)[64]、Gabor滤波器[65]和主成分分析(PCA)[66]。在这些算法中,HOG和LBP及其变体统一LBP(ULBP)已被证明在各种任务中非常成功,例如对象分类[67],人类行为识别[68],面部识别[69],行人识别[70]和生物信息学[43]。具体而言,在静态纹理描述符中,LBP及其变体[62,63]在图像处理和计算机视觉领域很有名,因为它们的计算简单[68,71]。特别是ULBP是稳定的,不易出现伪影,使标签的数量显着减少,并提供可观的估计和统计鲁棒性。同样,HOG记录了有吸引力的特性,如更好的光照不变性,并且在文献中特别描述为用于提取形状、外观和纹理特征的强大方法[61,63,71,72]。因此,HOG已成为基于内容的图像识别的流行HOG和ULBP算法被选择来提取颜色特征,基于这些有吸引力的特性和随着时间的推移从文献中获得的声誉[61,68,71,73]。在这项研究中,我们为彩色输入图像的每个通道计算ULBP,以获得59每个图像3个维度。同样,我们应用33个街区的细胞和9箱,以生成紧凑的HOG特征向量,81每个彩色产品图像中的3个元素。为了进一步改善图像的空间对齐,集成了3D颜色模型。选择RGB颜色模型基于其优于其他颜色模型的性能,如[26,74]中所报告的。文献中已经报道了减少特征向量以提高分类器的性能[64,69,75,76]。特别是,由于一些基因组图像的低维度,Adetiba和Olugbara[75]在努力降低特征向量的维度时,应用了2 × 2个细胞块和9个箱的最小维度,以从灰度图像生成36个元素的紧凑HOG基因组特征向量。为此,我们提出了一种基于特征向量原理的简单降维算法,对维数为81 3的cHOG特征和维数为81 3的cULBP进行降维59个3 ~ 81个和59个最主要主成分元素特征向量。我们中断了广泛使用的PCA的最后一步,即特征向量的投影。这是必要的,因为在本研究的实验数据集上使用投影特征[66]获得的准确度结果低于其特征向量对应物。3.4. 本征颜色特征彩色图像通常产生高维特征向量,并且众所周知,高维向量将增加计算复杂度,而性能没有实质性的改善。因此,N3彩色图可以被进一步处理以实现更好的性能的装置可以被进一步处理以实现更好的性能。这本质上是为了消除维数灾难[77,78],从而降低了基于图像的分类架构中模式分类器的计算复杂性[79]。在本文中,我们已经应用了基于特征向量的算法来提取颜色特征的NX 3的颜色特征,获得使用彩色图像描述符。该方法的本质依赖于本征分解等的潜力,以关联甚至伪影损坏的特征。这与使用PCA的传统降维策略不同,PCA直接对数字化原始图像和投影特征向量进行操作[66]。在这项研究中,进行了以下步骤来计算从给定的彩色图像中提取的Nx3特征矩阵的本征颜色特征(ECF)步骤1:首先针对M = 3计算表示为X的N3特征矩阵的平均ux,如下:Nu X m n对于m1 23 1N×Mn¼1步骤2:通过如下减去步骤1中针对每个元素计算的平均值,矩阵X的元素被平均居中:Xi;jXi;j-lx对于i 1; 2;.. . ;N;在此阶段减去均值非常重要,因为它确保了特征矩阵表示最大方差的方向[80]。步骤3:获得在步骤2中计算的矩阵X的协方差矩阵,以如下导出NXN方阵X i j X i jTAði;jÞ ¼N-1对于i1; 2;. ;N;j1; 2;3在该阶段计算协方差矩阵,以便近似地捕获NX3颜色特征矩阵中的元素的方差和线性相关性。步骤4:现在从步骤3开始,特征值问题可以定义如下。给定一个N ×N协方差矩阵A,找到N空间中的所有向量Y,使得:A-kIN88S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)83.... ¼0ð5Þ.TP.其中k表示称为特征值的常数值,其为对角元素,Y为相关特征向量。上面的等式捕获了方阵、特征值和对应的特征向量之间的关系。方程是a有非平凡解的齐次方程当且仅当如果Y是非零向量。因此,满足Eq.(4)可以通过分解a1; 1-ka1; 2···a1;Na 2; 1a 2; 2-k ···a2;N最常用的前馈网络拓扑之一是多层感知器(MLP),因为它拥有前馈ANN的所有上述功能[88,89]。基于此,MLP是本研究采用的神经网络分类器。首先,MLP-ANN拓扑结构包括输入层、隐藏层和输出层,这些层通常包含基于训练数据集的结构和预期精度水平的不同数量的神经元。MLP的训练数据集通常由一组特征(xp,tp)组成,其中p表示元素的数量特征向量中的元素; xp是输入特征向量,而x p是对应的目标向量。对于cHOG-ECF,.······aN;1aN;2···aN;N -k与[81]中所做的类似,特征值k被计算为等式中N阶特征多项式函数的根。(五)、这些值k1;k2;. ;kN按降序排序为我们提供了按重要性顺序排列的分量及其相应的特征向量Y [80,81]。在方阵A中,与最小特征值相关联的特征向量表示最小特征值。方差,而具有最高特征值的特征向量表示提取的特征数据的最大方差[82]。这表达了数据维度之间最重要的关系,并作为产品图像数据集的最主要的主成分。在这项工作中,我们从这些独特的性质本征向量。因此,与协方差矩阵A中的最大特征值相关联的特征向量表示在所提出的工作中使用的本征颜色特征(ECF)。在本研究中,根据cHOG和cULBP特征计算的ECF分别命名为cHOG-ECF和cULBP-ECF这些特征被传输到所提出的架构(图1)中的最后一个块,以训练选定的分类器。3.5. 产品分类为了实现我们提出的体系结构(图1)中所示的产品图像分类的目标,我们将任务制定为多类分类问题,其中相似的图像与有限数量的已知类相关联,如xi; y in,其中xi2 ffin是第i个产品图像,y i2 f 1;.:;k g是第i个类标签。这个分类过程是从输入变量xi的集合到输出变量的集合的映射,输出变量是类标签yi。任何有监督的多类分类的目标分类算法是将不可见图像I分类为属于一个使用从图像I获得的特征向量从所有现有的k个图像类中分类。在这项工作中,两个流行的分类器,人工神经网络和支持向量机进行了实验比较,以解决产品图像分类任务。ANN是一组相互连接的人工神经元,使用计算模型来模拟生物神经系统的结构和功能[83,84]。输入神经元之间的互连和数据传播的模式称为人工神经网络的网络拓扑。ANN拓扑结构的两种主要类型是前馈网络和递归网络。前馈神经网络中的数据流是在从输入神经元到输出神经元的正向方向上,没有连接的反馈,但是递归网络包含反馈连接。在基于前馈ANN应用的许多研究中已经提到,网络拓扑能够近似复杂的非线性映射,它包含高度并行性,处理噪声数据,并为经典参数技术无法处理的问题提供模型[85]。此外,前馈人工神经网络具有内在的泛化能力,使其能够识别和响应与其已训练的模式相似但不相同的模式[86,87]。cULBP-ECF特征向量在本研究中,p值分别为81和59。基于这些特征的维度,用cHOG-ECF训练的MLP-ANN在输入层中需要81个神经元,而用cULBP-ECF训练的网络在输入层中需要59个神经元所需的隐藏层数量和MLP-ANN的每个隐藏层的相关神经元数量根据所解决问题的性质而变化,并且通常通过适当的实验来确定[90]。在第4节中描述了我们为确定当前研究中MLP-ANN隐藏层中神经元的适当数量而进行的实验。如表1所示,本研究中100个类别中每个类别的tp使用每类一个编码方法[91,92]进行编码。如表中所示,每个类目标向量包含100个元素,其中类号的位置为1,其他位置为0。由于每个输出神经元被指定为识别给定类的任务,因此在MLP-ANN的输出层中需要100个神经元当考虑更多参数或更复杂的网络拓扑时,确定正确的权重组合所需的计算工作量大幅增加[93],因此需要选择适当的算法来处理此类学习问题。用于学习的最流行的ANN算法之一是反向传播(BP)算法[94]。BP训练算法使用梯度下降法调整网络的权重和偏差最小化误差函数的权重的计算被认为是学习问题的解决方案已经报道了BP算法的许多变体,其中包括共轭梯度( CG )、缩放共轭梯度(SCG)和拟牛顿BP算法[95]。在本研究中,我们采用SCG-BP来训练设计的MLP-ANN,以便利用其备受赞誉的收敛速度[41,96]。SVM是我们的第二选择模式分类器,由Cortes和Vapnik于1992年引入,作为基于结构风险最小化归纳原则的机器学习模型[97,98]。它是一种监督学习模型,由于其在广泛应用中的卓越性能及其处理高维数据的能力而受到欢迎[48,99,100]。虽然SVM最初是为二进制分类而开发的[90],但它也可以扩展以满足多类问题[44]。传统的方法是将多类问题分解为多个类问题组,然后构造多个二进制分类器。 目前,常用的两种技术是一对一(1A1)和一对所有(1AA)技术[101,102]。然而,基于其简单性和过去的文献效率跟踪,选择1AA进行这项工作[103]。SVM分类器的核函数的选择也是非常关键的。SVM中使用的流行核函数的示例是多项式、径向基函数(RBF)、线性和二次[104]。多核学习(MLK),其涉及两个或更多个核函数的组合(以利用它们各自的优势)也用于增强S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)8389表1每类一个编码。类别/索引1234567891112十三... .9899100Class1100000000000... .000Class2010000000000... .000Class3001000000000... .000.. .. . ... .. ......你好。.. .. . ... .. ......你好。98级000000000000... .100九九级000000000000... .010100级000000000000... .001SVM分类器的性能。这种MKL的示例是[26]中的组合RBF和线性内核(LaRBF)、RBF和多项式内核(RBFP)[105-在这项工作中,不同的核函数进行了测试,以获得一个适当的单一SVM。我们还在不同的内核函数中将交叉验证从10倍变化到20倍[25,109]。3.6. 模式分类器许多研究人员已经研究了将多个分类器的预测相结合以实现更好准确性的技术,这一概念通常被称为集成学习[40]。两种用于创建精确集成的流行方法是bagging[40]和Boosting[110,111]。在[40]中,作者明确指出,装袋是可以有效应用于问题学习的最有效方法之一。在此背景下,我们将Bagging集成应用于本研究.Bagging集成方法是一种基于投票的分类算法,它允许多个“弱”分类器组合以产生更准确的“强”分类模型。这个名字来源于Bootstrapaggregating[40]。 该算法通过对原始数据集进行不同的采样来工作,然后通过使用统计自举采样[111]方法重新组装数据集,以创建和训练多个分类模型。然后,使用多数表决算法将模型的输出合并。Bagging的总体架构如图3所示。在本研究中,Bagging集成被应用于生成MLP-ANN和SVM集成分类器的基分类器4. 实验装置在这项研究中,进行了四个不同的实验,以建立适当的算法和分类器的提议的架构图1。所有实验都在MATLAB R2014环境中在Intel Core i5-2540 M CPU@2.60 GHz速度、4.00 GB RAM、500个硬盘上进行,并且其运行64位Windows 7操作系统。第3.1节和第3.2节分别详细描述了实验数据集和对其进行的预处理操作。为数据训练、验证和测试选择最佳数据划分比例通常对ANN模型的性能至关重要[112]。 在第一个实验中,利用cHOG-ECF训练11个不同的单个MLP-ANN。与[31]中所做的类似,我们通过实验确定了60%:20%:20%、70%:15%:15%和80%:10%:10%数据划分方案提供的准确度,当第一和第二隐藏层中的神经元数量从10到110变化时。具有最佳精度的MLP-ANN结构,然后使用装袋集成程序,以获得用于集成MLP-ANN的基分类器。在第二个实验中,使用cULBP-ECF代替第一个实验中的cHOG-ECF。第一个实验中的所有其他程序随后重复用于第二个实验。在第三个实验中,使用cHOG-ECF通过改变核函数(包括线性、二次、多项式、RBF以及多核LaRBF)来训练五种不同的SVM模型,其中具有最高精度的模型被用作Bagging集成操作的基分类器以获得SVM集成。在第四实验中,cHOG-ECF图三. 包合奏建筑。分类词的扩充分类器培训测试数据集简化训练数据集(cHOG,cULBP)分类器2…...合并网络输出(投票算法)分类结果分类器nn的训练90S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)83用cULBP-ECF代替实验3中的特征,然后重复第三个实验中的所有不同实验的结果在下一节中报告5. 结果讨论在该架构的第二块中使用中值滤波器的预处理操作的输出在图1和图2中示出。4和5. 具体来说,图。图4a和图5a分别包含罐头和婴儿鞋类中的一个物品的原始图像以及它们的红色、绿色和蓝色通道的直方图。图像以及每个颜色通道的直方图中值滤波后是应用是也示在图4B和5B。原始图像的通道直方图的定性比较(图4 a和5 a)和滤波图像的那些(图4 a和5 a)。图4a和5a)已经示出了滤波后的图像通道的像素分布不同于原始通道的像素分布。例如,图4a中的150和200强度之间的红色通道的像素分布密度大于图4b中的滤波图像的对应红色通道中的150和200强度之间的像素分布密度。这清楚地说明了中值滤波的平滑效果,从而增强了从图像中提取更具鉴别力的颜色特征。这一结果与其他研究人员[52,113]关于噪声滤波对图像特征提取的影响的立场一致。见图4。 (a)来自Can类的图像的原始输出和(b)过滤输出。S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)8391图五. 来自Baby Shoe类的图像的原始(a)和过滤(b)输出。所提取的HOG特征对于不同类别中的每个产品项目是唯一的,如图1和2所示。6和7线图。图6示出了从图2中的每10个产品类别中随机选择的项目的cHOG-ECF向量的线图。如图所示,每个类别被显示为具有不同颜色和cHOG-ECF提取的特征之间的明显差异的线图。来自Babyshoe类的项目的cHOG-ECF向量从第一个元素到最后一个元素始终具有低值,具有不同的峰值水平,如线图中所示。相反,来自Briefcase类的项的cHOG-ECF向量从具有峰值的第一个元素到最后一个元素始终具有最高值最低为0.0063。图7示出了图1的线图。来自图2中的10个产品类别的图像的cULBP-ECF向量。与图6中的结果不同,关于它们的峰值存在重叠,并且从图6中获得的值的区别较小。不同类别的产品。该结果定性地示出了cHOG-ECF高于cULBP-ECF的区分强度图图8和图9示出了公文包类中的图像在很大程度上在它们的形状和颜色内容方面是相似的。对图8进行彻底的目视检查证实,从0.05及以上,大多数cHOG-ECF载体重叠,显示了它们的相似性程度,而在碱基处几乎没有变化。图8传达了类似的概念,具有类似的特征峰和尺寸。然而,与cHOG-ECF相比,cULBP中记录的重叠数量较少。在cULBP-ECF载体的尾端处突出的峰的奇异激增是存在于9和11两者中的另一个常见且值得注意的特征从Helmets类生成的一组特征出现相同的趋势,其中许多峰值出现在0.02及以上的相同邻域中。 如图 10个 重叠92S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)83BabyShoecHOG-ECF夹套cHOG-ECF营养cHOG-ECF牛仔cHOG-ECF耳环cHOG-ECF花卉cHOG-ECFCancHOG-ECF)头盔HOG-ECF徒步旅行包HOG-ECF公文包HOG-ECFBabyShoecULBP-ECF夹套cULBP-ECF营养cULBP-ECF牛仔帽cULBP-ECF耳环cULBP-ECF花朵cULBP-ECF取消ULBP-ECFHelmetscULBP-ECF徒步背包cULBP-ECF企业简介ULBP-ECF0.350.30.250.20.150.10.0500 10 20 30 40 50 60 70 80cHOG-ECF向量索引见图6。10个不同产品类别图像的cHOG-ECF线图。10.90.80.70.60.50.40.30.20.10010 20 30 40 50 60cULBP-ECF向量索引图第七章10个不同产品类别图像的cULBP-ECF线图当与图8中显示的线图相比时,特征不太明显。在第34个和第56个cHOG-ECF向量之间产生的峰形成谷形,其中显著地记录了范围为0.15和0.2的较低峰。与从图9中的用于公文包的头盔类uLBP-ECF向量生成的特征不同,HelmetuLBP-ECF的特征的区别较小。这是图11中的线图的证据,其中记录了较少的重叠特征。尽管不同产品类别的提取特征的形状是相似的,但它们的峰值以及形状尺寸是独特的,如图1A和1B所示。6和图7这些特性为使用机器学习来区分每个类提供了坚实的基础。因此,为了进一步定量地建立这两个图像特征描述符的区别,使用以下进行了四个实验:模式分类器当神经元的数量从10变化到110时,从这三个数据划分(交叉验证)方案的实验比较中实现的结果示于表2中。从表中可以观察到,当uHOG-ECF图像特征分别用于训练具有60%:20%:20%、70%:15%:15%和80%:10%:10%数据划分方案的单个MLP-ANN时,实现了83.20%、81.6%和78.09%的最佳分类精度。当隐层中分别有100个、100个和90个神经元时,这三种方案的精度最高。这个单一的信息指导我们选择70%:15%:15%。此外,当uHOG-ECF用于训练单个MLP-ANN(具有70%:15%:15%的数据划分方案,在两个隐藏层中具有100个神经元)时的结果的细节在图12中示出。每个隐藏cHOG-ECF值cULBP-ECF值S.A. Oyewole,O.O. Olugbara/ Egyptian Informatics Journal 19(2018)8393公司简介HOG-ECF 1公司简介公司简介公司简介企业简介HOG-ECF 4公司简介公司简介企业简介HOG-ECF 80.350.30.250.20.150.10.0500 10 20 30 40 50 60 70 80简介案例HOG-ECF矢量索引图八、从公文包产品类别
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功