改进的模糊深度学习模型在乳头涂片细胞图像分类中的应用

51 浏览量更新于2023-12-10 收藏 1.82MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

智能系统与应用16（2022）200133一种用于管理不确定性的改进模糊深度学习（IFDL）模型在乳头涂片细胞图像分类Mona Benhari，Rahil Hossseini*伊朗德黑兰伊斯兰阿扎德大学Shahr-e-Qods分校计算机工程系A R T I C L EI N FO保留字：深度学习不确定处理Dempster-Shafer证据理论细胞图像分类，模糊系统A B S T R A C T近年来，深度学习模型在医学图像分析中的应用已经集中起来。巴氏涂片细胞和宫颈癌的自动检测系统是一个具有挑战性的问题，由于耗时和错误的检测过程中的技术人员。这项研究提出了一种改进的深度卷积神经网络（DCNN），用于分析巴氏涂片图像，以早期检测宫颈癌。该模型解决了DCNN分类层中具有相似概率的样本分类问题。为了应对这一挑战，提出了一种改进的模糊深度学习（IFDL）模型，该模型利用了使用Dempster组合规则的深度信念网络和模糊加权系统来管理分类层中相似类别的不确定性。在该方法中，一个新的层由信度网络使用Dempster组合规则，聚集的证据来处理分配正确的类，不同的类之间的不确定性。针对信度网络中的对象拒绝问题，提出了一种模糊加权系统。在Herlev细胞图像数据集上对两类问题和七类问题的实验结果表明了该模型的优越性。该模型的准确率为99.20%，优于同类方法，有望用于宫颈癌的早期检测1. 介绍宫颈癌是世界范围内死亡率最高的恶性肿瘤之一，尤其是在发展中国家。子宫颈抹片检查是一项每年一次的检查，建议妇女及早发现或预防子宫颈癌。在巴氏涂片检查中，细胞学家分析数千个宫颈细胞以检测异常细胞。巴氏涂片筛查细胞学家是一个繁琐和耗时的过程，因此使用自动巴氏涂片筛查系统认为是必要的。巴氏涂片图像分为七种类型：正常浅表，正常中间，正常柱状（与宫颈组织的不同层有关），轻度发育不良，中度发育不良，重度发育不良和癌（显示细胞的恶性）。巴氏涂片细胞检测的主要挑战是，由于细胞核的大小和细胞外观，柱状细胞与发育不良细胞非常相似。这个问题在分类过程中造成高度的不确定性。因此，不确定性处理对于改善分类算法的可靠性以接近于人的行为（没有任何预先判断或常见的人类错误）。下面列出了医学系统诊断（如巴氏涂片图像分析）中的不确定性的可能来源（Hosseini等人，2010年）：输入数据的不精确性和显微镜巴氏涂片图像和噪声测量中的模式特征，专家的内部不确定性和对细胞分类的犹豫，其他人对专家的词语感知，非平稳特征，用于测量图像复杂特征的数学模型的不确定性，专家之间的细胞分类的内部不确定性和不确定性，以及图像增强、分割、特征提取和分类方法等各个过程的不确定性。更准确的图像增强和分割导致更准确的分类。此外，特征设计和特征提取在分类过程中起着重要的作用.每一个相位中的误差都会传递到下一个相位，降低系统的性能。深度卷积神经网络是一种将图像增强、分割、特征提取和自动特征提取相结合以提高分类性能的新方法，近年来取得了可喜的成果* 通讯作者。电子邮件地址：rahil. qodsiau.ac.ir（R. Hossseini）。https://doi.org/10.1016/j.iswa.2022.200133接收日期：2022年7月22日;接收日期：2022年9月24日;接受日期：2022年9月29日2022年10月4日网上发售2667-3053/© 2022作者。由Elsevier Ltd.发布。这是CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表智能系统及其应用杂志主页：www.journals.elsevier.com/intelligent-systems-with-applicationsM. Benhari和R. 侯赛尼智能系统与应用16（2022）2001332图1.一、建议的IFDL模型的架构。问题研究然而，DCNN研究没有管理分类过程的不确定性，准确地将具有不同类型的相似细胞分类。本研究探讨了这一问题。所提出的IFDL模型可以管理不确定性，以解决分类过程中与相似细胞外观相关的模糊性郑通等人（Tong et al.，2019），提出了一种使用Deep CNN和Dempster-Shafer（DS）理论来管理分类过程的不确定性的对象检测方法。该方法将证据与DS理论相结合，计算每类证据的概率。较高类别概率是输入对象的获胜者类别。如果获胜类的概率小于阈值，则拒绝该对象。但是这种拒绝可能会忽略数据集中有价值的数据，并且这种方法不适合有限的医学图像。该研究提出了一种新的改进的模糊深度学习（IFDL）模型，该模型利用贝叶斯信念网络理论进行细胞图像分类。此外，模糊逻辑已被应用于解决与巴氏涂片样本拒绝（未分类的样本）在贝叶斯信念网络的输出的不确定性。新的IFDL模型可以管理分类过程中的不确定性，并解决拒绝样本的问题，这是非常有价值的，特别是在分类巴氏涂片细胞的贝叶斯信念网络。所提出的IFDL模型是有益的医学图像处理与低体积的图像数据集和不确定性分类异常。2. 文献综述传统的计算机辅助检测（CAD）系统或每个图像分类系统（Dash等人， 2022; W o'zniak等人 2021）具有图像增强、分割、特征提取和分类四个阶段。在图像增强和图像分割中，Sahba等人（2003），Lu等人（2015），Nosrati和Hamarneh（2015），Hansang Lee和Junmo Kim（2015），Lu等人。（2015年）。图像增强和图像分割在计算机辅助检测系统（CAD）中起着重要的作用。分割越准确，检测系统就越准确。由于这一重要性，2014年和2015年举行了几次分割挑战，特别是细胞分割。Nosrati和Ghassan Hamar-neh，2105;Hansang Lee Junmo Kim，2015; Araujoa等人，2018年）。为了处理分割不确定性（William等人，2019）提出了一种Weka分割和图像增强的顺序方法。在分类系统特别是学习过程中，选择合适的特征数对于特征提取和特征选择（William et al，2019），应用进化算法和Mohammad Subhi et al. （Al-Batah等人， 2014）提出了一种用于特征选择和提取的自动特征提取（AFE）算法。但这些步骤的误差会转移到分类步骤中。为了应对这一挑战并进行更准确的检测，卷积神经网络（CNN）已应用于最近的研究（Cheng et al.，2022年;Tang等人，2022; Huang等人，2021年）。CNN从输入图像中通过层提取特征图，而无需任何单独的分割过程。此外，如前一节使用（DCNN）所述，由于直接从输入细胞图像分类而不依赖于分割和特征选择步骤，导致更准确的分类和细胞检测（Martinez等人，2020年; Wu等人，2019; Abhinaav和Brindha，2019; Bora等人，2016年，准确率超过90%。但这些研究都面临着细胞图像来源的局限性，尤其是巴氏涂片图像，因此结果并不可靠。为了解决这个问题，已经应用了预训练的CNN和转移学习方法（Harangi等人，2019; TwinkleDalal和Manjeet Singh，2021; Long D. Nguyen等人，2018; Dharani等人，2020; Sompawong等人，2019; Taha等人，2017; Zhang et al.2018; ChihimWaly et al.， 2021; William等人，2018年; William等人，2019年），批准了prom-结果超过95%。此外，过去两年的许多研究，（ OrhanYaman 和 TurkerTuncer ， 2022;Khamparia 等人，2021;Kumararaja &Deepa，2021; Mohammed等人，2021; Diniz等人，2021; Bhatt等人，2021; Palanisamy等人，2021; Tripathi等人，2021;辛格例如，2021; Rahaman等人，2021; Basak等人，2021）提高了分类准确率超过98%。但这些研究都没有考虑不确定性处理。在建议的IFDL模型中，分类过程的不确定性得到了解决。本研究的其余部分组织如下：第2节，解释了方法和材料的形式提出的模型。第三部分是模型的理论基础。第4节包括实验结果的讨论。最后，第五部分对研究结果进行了总结。3. 方法和材料在本节中，详细解释了该方法的体系结构和模型的步骤。3.1. IFDL模型的体系结构本节研究所提出的模型的数学模型和架构。建议的模型，提出了一个新的CNN架构-M. Benhari和R. 侯赛尼智能系统与应用16（2022）2001333∑（）下一页⊕（）下一页（A）=1 2m（B）m（C）12×.）=闪烁（闪烁）（）=关于我们假设Ω={w1，w2，∑to型p，u=1。） =1M结构的能力，不确定性处理的深层结构，使用Dempster组合规则和模糊集理论。在本研究中，信念网络使用Dempster-Shafer规则进行证据组合。利用DS理论对独立证据进行集结，以处理分类方法中的不确定性。同时，将模糊逻辑与信度网络相结合，提高了系统的效率，防止了低概率类的对象拒绝。模型的输入是细胞图像，细胞图像的类别被认为是系统的输出。图1示出了所提出的模型的架构。巴氏涂片细胞图像是卷积层的输入，并且通过深层提取特征。在全连接层中提取的特征图被发送到距离层，用于计算每个特征图与原型（原型是数据集中代表性样本的特征图）之间的欧几里得距离。置信函数层将每个类的概率计算为向量m和μ，其中μ是与下一层中的向量m组合的m的副本。Dempster规则结合了m和μ。模糊化层的权重调整，建议处理细胞重叠的不确定性，并被应用到DS层更好的预测。∑m（A）=1（2）AΩm A是我们对A的信念量，对于任何A<$Ω。当m（A）>0时，集合A称为m的焦元可信度函数bel（A）是不确定性的下限，可信度函数pl（A）是不确定性的上限，与m对于任何AΩ，定义为，bel（A）=∑m（B）（3）BApl（A）=m（B）（4）AB闪烁=量bel（A）被解释为一个人对假设A为真的信念的整体度量Dempster提出了一个由算符表示的规则，称为Dempster规则，它可以组合两个质量函数m1和m2。这些质量函数表示独立的证据项，如下所示：在所提出的IFDL模型中，特征映射的权重在卷积层期间更新。池化距离函数mB<$C=Am1（B）m2（C）BC闪烁=（五）层计算每个特征图和每个原型之间的距离。原型显示了数据集的代表，这是通过k均值聚类选择。距离函数层的输出节点是节点和每个pro-totype之间距离的结果。这些值被视为事件，并使用Dempster规则进行聚合。为了解决信度网络输出中的样本拒绝（未分类样本）问题，应用模糊逻辑过程对样本的类别进行决策。增广后的输入张量为[224 224 3]，Google-Net中全连接层之前的最后一个卷积运算张量是一个初始层过滤器大小为[3 3]。通道数为832，过滤器数为128，步幅为[1 1]，填充大小为[0 0 0]。此外，全连接层的大小为[1 1000]。拟议的IFDL模型包括以下几层：卷积层，卷积层提取输入图像数据的特征图。特征被发送到置信网络以计算距离（等式10）。（六）。应用Belief函数，将特征映射图输入到Belief网络中。计算每个特征图和原型（数据集的所选代表）的欧几里得距离，然后计算每个类别的概率（等式2）。 7）。Dempster组合规则：不同类别的概率使用Dempster规则（等式2）聚合。 9）。模糊化过程：为了防止拒绝信度网络，特征空间的模糊模型已被应用于Dempster规则。这种模糊系统方法利用了所有的图像单元，并防止了信度网络的样本拒绝下面的小节详细解释了所提出的模型的基本理论。4. 基于Dempster规则在本节中，呈现了作为基础理论的信念网络和Dempster规则的简要概述（Tong等人，2019年）。决策系统中不确定性建模的有效工具之一是Shafer在1976年提出的证据理论（G.，1976年，由邓普斯特完成。Denoeu X（Tong等人，Denoeu X，2000）将这一理论应用于信念网络和CNN。在这个规则中，如果A兰蒂昂 M1 M2 ϕ0时，所有质量都可以合并（DenoeuX，2000）。信度函数提供了一种基于Dempster规则的自适应模式分类器。每个类都有一些模式或原型被认为是与它们的类相关的证据。对于每一种证据方法，分配了一个质量函数，该质量函数由Dempster规则组合。信念激活函数集合Ωw1，w2，图像，因为这种分类方法是两类问题（正常和异常），所以集合有2个成员。每个细胞是信念理论中的证据，每个原型是从图像数据集中选择的，然后计算m。输入x∈Rp被输入到模型中，用于分类到M个类别中的一个（在我们的数据集中，M= 2正常和异常）。类由w1，P维。用质量函数计算了X类的不确定度。该质量函数或权重函数是针对每个类别的权重Ω = { w 1，.，w M }计算的该算法有五个步骤的IFDL层的形式n个原型p1，距离函数层，向量p的维数为ks，其中k从k-means聚类算法中提取，以找到样本的最佳代表。k是按顺序选择的，并且s等于输入样本大小。需要说明的是，样本是作为分类层输入的全连通层的特征图，而原型是通过k-means算法选择的样本的代表。步骤1：距离函数层计算每个输入和每个原型之间的距离。di=x-pii=1，步骤2：对于每个di，激活函数的参数ηi（ηi<$R），αi∈（0， 1）为，si=αiexp（-ηidi2）（ 7）步骤3：每个原型pi的质量函数mi计算如下：m i=.m i{w1}，.，m i { w i }，m i（Ω）T.ui si，其中u i=（u i，.，u i ）是与每个亲相关的先验概率，质量函数m（）是从2 到[0， 1]，其中1M条件：m（m）=0（1）IM我j=1 J步骤4：节点权重由相同的质量函数计算M. Benhari和R. 侯赛尼智能系统与应用16（2022）2001334++1M+1M+1∑（）2β++++2∑.）Nx∈Xj=1我∑J1MJJJJM+1JJJJM+1JJJ我n11我与Dempster规则的输出相结合，防止样品剔除。该模糊系统通过考虑细胞类别中的重叠来提高分类效率。模糊输出定义为Eq。十一岁模糊系统的输出个数为M类。模糊系统的输出值被分配给最近的类，其补充被分配给另一类。Y i=.yi，步骤5：等式12定义了如何将模糊系统纳入Dempster规则。μi = Y i（μi-1m i. {w j}）+ μi-1m i（{Ω}）+ μi-1m i. {w j}））（12）图二. IFDL模型框图的步骤。mi，i=1，.，n，与Dempster规则相结合。μ i=（μi，.，μi），i=1，..，由m计算的n由以下等式定义：信度网络分类器使用Dempster-Shafer理论进行M1部分的预测，M部分与M类相关，第M1部分与样本拒绝相关。这种拒绝可能会导致有价值的信息的丢失，特别是当样本数量有限时。为解决分类方法中的高不确定性问题，防止样本拒识，提高分类效率，采用了所设计的模糊加权系统的响应。因此，在样本拒绝的情况下，模糊系统预测网络输出的类别该方法的步骤在图1所示的方框图中概括。二、4.1. 信念网络在Eqs. 在等式（7）和（8）中，αi，ηi，u i被初始化如下：γ i=. ηi）2（13）μ1 =m1μi = μi-1m i. {w}）+ μi-1m i（{Ω}）+ μi-1m i. {w}）（9）α=1 + exp. （14）对于i = 1，..，n和j = 1，.，M和μi = μi-1mi（{Ω}）i =2，.，n（βi）2当量9定义了Dempster正交和。在这个公式中，证据的组合是通过m和μ的三个乘积和来执行的在不同的节点。DenoeuX（DenoeuX，2000）代表分类-uj=Mk=1（十五）Ij通过μ的最后一个节点的作用。对于每个类1到m1，最大概率是获胜类，如果第M1个元素的概率低于特定阈值，则拒绝样本。为了防止这种样本拒绝（DenoeuX，2000年），Dempster组合规则的输出被发送到建议的模糊层，并对样本类作出最终决定。模糊逻辑在管理不确定性方面具有很高的潜力，并在决策支持系统中提供了很高的可解释性。一个模糊集包含一类具有隶属度的对象。隶属度等级由隶属函数分配，隶属函数是0和1之间的数字。这种分配对于近似推理是适当的。在现实世界中，隶属函数的标准往往不是准确例如，在巴氏涂片图像分类中，一些细胞具有为了训练网络，通过IFDL误差的偏微分来更新这些参数。在神经网络应用中，网络误差通常是由预测类与实际类之间的差来获得的对于M类M1，概率由网络计算，但实际具有M部分。如果v等于0，则可信度，如果v等于1/M，则可信度，并且如果v等于1，则中间概率计算类别wq目标向量定义为：t=（t1，t2，...，t m），预测向量定义为：当pv，q = m q + vm M + 1时，通过定义目标向量和预测向量，误差定义为（DenoeuX，2000）：M对某一特定类别的模糊分配。模糊集能够模拟重叠类的巴氏涂片细胞类型。之一Ev=1pv，q-tq2（16）q=1巴氏涂片细胞图像分析和分类中的主要挑战和困难在于，正常柱状细胞在形状和大小方面似乎与癌细胞相似，从而导致响应于Dempster组合规则的样本拒绝。为了管理这种不确定性，模糊系统的能力已经与信念理论相结合，用于巴氏涂片细胞的分类。为了设计这样的模糊推理系统，卷积层提取的特征被用作模糊系统的输入。所提取的特征被认为是包括n个样本和k个特征的输入向量F，如下：Fi=（fi，在学习过程中，网络在每次迭代中的误差由大小为N的训练集X的平均误差定义：Ev=1∑Ev（x）（17）下面解释在学习过程中最小化Ev。学习过程包含优化参数，以最JM. Benhari和R. 侯赛尼智能系统与应用16（2022）2001335小化方程中的误差函数。十六岁首先，参数初始化具有约束0α 1，γ> 0，执行Muj=1，其中i显示原型的数量，j是类的数量，然后在每个迭代中，每个训练样本的误差由16计算，并且模糊系统的输出被定义为加权因子，训练误差根据等式（1）计算。十七岁参数基于梯度优化使用方程更新。十八到二十五岁M. Benhari和R. 侯赛尼智能系统与应用16（2022）2001336=J[∑）的情况下]（）下一页M.βi）2）M+1J图三. 数据集单元格类型。与参数sii1，M布勒姆u=s（mi+mi）+（二十一）v（x） ∑。）（j（i（一）ij M1J我我伊什岛为j=1我 pv，j-tjui mj+mM+1-mj-vmM+1（十八）根据等式（12），u j与β j有关，因此，执行βi：而mj由质量函数输出作为合取com得到m的两个质量的结合我n（x）∂2βi∑Ev（x）M拉乌. βi）2-∑.βi2Ev（x）拉乌（二十二）mj-mM+1×mjMil=1Lmi=M+1m+mij=1， 2，...，M（19）当k = scinj时，l是k=1，2，...，m的索引。此外，还有两个参数可以构造α和γmmM+1在Eqs. (13)（14）. 这些参数i和ηi计算误差M+1 =mi我MβJ我Ij（Ijl=1Ll=1LIlJ我我=M. Benhari和R. 侯赛尼智能系统与应用16（2022）2001337M1拉伊+根据m补数方程，Δm/Δu将为：（二十）衍生产品：Ev（x）=ηid i）2）。1-αi）αi（23）M. Benhari和R. 侯赛尼智能系统与应用16（2022）2001338==阿努岛为ni=DS阿尔普岛=i=S-2η表2七个班级的成绩。类别编号特异性%灵敏度%AUC%1类83.5172.3895.742类75.3388.9794.763类77.3863.7292.194类83.7278.8396.34类别593.8793.2699.716班95.0993.8799.23第768.5878.1093.15表3结果建议IFDL模型为2类。方法准确度%特异性%灵敏度%AUC%IFDL与Google-Net99.2099.7599.2599.97使用Res-Net 50的99.2099.2598.5199.99带Alex-Net的98.8099.7899.2599.91表4IFDL与基础方法的比较。方法准确度%特异性%灵敏度%AUC%IFDL98.5198.8098.4599.95CNN90.7147.0575.9073.29BF93.3995.0485.1396.16FL89.1086.9371.0380.12n（x）Ev（x）10、A（x）（i.. （i）2 （一）最后，为了更新原型，与pi相关的误差导数为：n（x）Ev（x）10、A（x）（. i）2i（（一））见图4。数据扩充过程。图五、在第三卷积层中提取特征。表1利用上述方程进行参数优化，以使误差最小化。优化过程继续进行，直到满足误差阈值或迭代次数达到特定次数（DenoeuX，2000）。在下一节中，将讨论实验结果。5. 讨论本节对所提出的模型进行了评价，并报告了其性能。使用Herlev数据集的标准公共细胞图像来评估所提出的模型的性能。采用ROC曲线分析方法对该方法的性能进行评价，并与现有方法进行比较。为了验证目的，应用5倍交叉验证的平均值。根据真阳性（TP）、具有真恶性预测的样本、真阴性（TN）、具有真正常细胞预测的样本、假阴性（FP）、具有假恶性预测的样本和（FN）、具有假正常预测的样本，准确度、特异性、灵敏度的等式如下：TP+TNIFDL模型的两类问题结果倍数准确度%特异性%灵敏度%AUC%精度=TP+TN+FP+FN（27）1 98.85 98.92 98.78 99.94100398.86 98.61 99.03 98.942019 - 04 - 28 00：00：00597.71 97.75 97.77 99.92平均值98.51 98.80 98.4599.95质量标准TNFP+TN灵敏度TP伊伊-2η（二伊伊xj-pj（二M. Benhari和R. 侯赛尼智能系统与应用16（2022）2001339TP+FN（二十八）（二十九）M. Benhari和R. 侯赛尼智能系统与应用16（2022）200133105.1. 巴氏涂片细胞图像数据集特征见图6。 R O C 曲线的AUC。组织）和轻度发育异常、中度发育异常、重度发育异常和癌（其显示细胞的恶性图 3显示不同巴氏涂片细胞图像数据集是众所周知的公开可用数据集（http：//mdelab.aegean.gr/downloads，）（），通过数码相机和显微镜在Herlev大学医院收集。图像分辨率为0.201m/PIXEL。通过常规巴氏涂片和巴氏染色制备标本。为了最大限度地提高诊断的确定性，共有七个不同的类别，由两名细胞技术人员和一名医生进行诊断。这些标记的细胞图像被用作所提出的模型的输入。巴氏涂片图像分为七种类型：正常浅表型、正常中间型、正常柱状型（与宫颈不同层次有关每种细胞类型的外观。它在每个类别中显示六个样本，以显示每种细胞类型在形状，大小和亮度方面的外观多样性。在数据集上实现IFDL模型有三种场景。第一种情况是将Herlev数据集分类为正常和异常细胞。第二种情况是将Herlev数据集分类为上一段中描述的七个类最后，第三种情况是对SIPaKMeD进行分类（Plissiti等人，2018）数据集分为三类。SIPaKMeD数据库由4049张巴氏涂片分离细胞的图像组成。这些幻灯片包括三类细胞：M. Benhari和R. 侯赛尼智能系统与应用16（2022）20013311表5不同的类描述。图第七章7类问题的 ROC曲线分析的 AUC 。将大小为3*3的均值滤波器应用于它，并且在图像（d）中，将盐和胡椒噪声添加到细胞图像中。在此增强过程之后，数据集的大小增加到大约三倍类别编号描述1正常浅表2规范中间3正常柱状4异常光发育不良5异常中度发育不良6异常重度发育不良7例异常癌正常（浅表和副基底细胞）、异常（挖空细胞和角化不良细胞）和良性细胞（化生细胞）。为了防止过拟合和提高精度，图像增强特别是数据增强起着重要的作用。因此，数据扩充包含数据旋转，并且图像滤波已应用于细胞图像。在巴氏涂片图像分析中，特别是Herlev数据集，异常细胞的数量远远多于正常细胞，为675到242，并且正常类中缺乏数据，导致该类中的学习率很差因此，正常细胞的数据增强对于更准确的分类至关重要因此，正常细胞图像在三个步骤中被增强三倍在第一步中，将正常细胞图像旋转90度并添加到数据集中。第2步，将滤波器大小为3*3的均值滤波器添加到数据集中。第三步，将椒盐噪声应用于图像并添加到数据集。图图4（a）示出了原始细胞图像。在图像（b）中，细胞旋转90度，在图像（c）中，与原始数据集相比，从242张图像增加到576张（包括675个异常细胞）。图像增强的过程提高了分类的准确性，并帮助深度卷积神经网络学习这两个类。为了处理增强过程中的噪声图像，在细胞图像中加入了盐和胡椒噪声，以检验所提出的IFDL方法的鲁棒性在数据增强之后，增强的数据集被发送到卷积层和池化层。图5示出了从第二卷积层提取的特征。这些特征图是全连接层的输入最后，分类层预测细胞类别。下一节讨论了所提出的IFDL模型的实验结果。5.2. 实验结果两类问题和七类问题的5重交叉验证的实验结果在表1和表2中给出。在表1中，在准确度、特异性、灵敏度和AUC方面，具有95%置信区间和0.26方差的5倍交叉验证的平均值分别为98.51%、98.80%、98.45和98.95%。由于训练和测试数据集划分的随机性选择，不同的折叠揭示了不同的结果。在表2中，示出了以下各项的ROC曲线的特异性、灵敏度和AUC：M. Benhari和R. 侯赛尼智能系统与应用16（2022）20013312见图8。 2类和7类的混淆矩阵提出的方法，七类问题的演示。详细地说，第五类（轻度发育不良）和第六类（严重发育不良）与其他类相比具有更好的性能，因为图像细胞和其他类的形状、大小和亮度性能较低此外，使用IFDL模型的两类问题的结果如表3所示。结果已经在不同的预训练网络中运行，包括Google-Net，Alex-Net和Res-Net50。M. Benhari和R. 侯赛尼智能系统与应用16（2022）20013310表6将所提出的模型与相应的方法进行比较方法准确度%特异性%灵敏度%AUC%Azur机器学习（Abhinaav R和D. Brindha，2019年）特征级联（Nguyen et al.2018年）90.18 93.56 93.33九十二点六十三分--深层巴氏检查（Zhang，et al. 2018年）98.3098.3098.20 99.80EML（EML）（AlhimWaly等人，2021年）迁移学习（VGG19）与学习（Bhatt et al. 2021年）迁移学习（Res-Net）与学习（Bhatt et al.，2021年）迁移学习（Efficient-Net）与学习（ Bhatt ， et al.2021年）Bi-pathDeepCNN（ Desianiet al.2021年）DEEP-BRONX（Rahaman et al.2021年）DCAVN（Khamparia et al.2021年）增强的深度特征（Basaket al. 2021年）97.96 - 96.99-85.15 88.2293.14 92.8193.03 94.2791.00 91.00 87.00九十八点三十二分--98.1 99.2 98.398.32 97.65 98.66IFDL [本研究]98.51 98.8098.4599.95使用Google-Net的IFDL（99.20%和99.25%）指定了最大准确度和灵敏度，使用Res-Net（99.99%）指定了最大AUC。Google-Net和Alex-Net的灵敏度也是99.25%。可以说，所有的网络在竞争中都有一点不同，但总的来说，Google-Net具有更好的表现。此外，IFDL模型的结果与基本分类方法如CNN与soft-max，置信网络（BF）和模糊逻辑（FL）进行了比较表4示出了基本模型与IFDL模型的比较结果。IFDL模型、CNN with soft-max、BF和FL的准确率CNN的特异性为45.05%，为最小值。这意味着soft-max分类器检测正常细胞的能力低于其他模型。此外，灵敏度为75%，这是不可靠的。所提出的IFDL模型具有98.80%的特异性和98.45%的敏感性，似乎更可靠。如表4所示，与基础分类方法相比，该模型在特异性、灵敏度和AUC方面的平均改善分别为7%、18%、21%和16%IFDL模型的ROC曲线分析如图6所示。AC-根据图6（a），IFDL模型的ROC曲线的AUC为99%，而对于置信网络方法，图6（a）。 6（b）为96%。IFDL的AUC直到0.9与TP轴相切，而在BF方法中直到0.9与TP轴相切。0.5与TP轴相切。七个等级图第九章 ACC、SPC、SEN和AUC的评价图表7问题如图所示。第七章在ROC曲线中，五类和六类X具有最高的下SIPaKMeD的结果与最先进的方法进行比较。ROC曲线。在下一个水平中，1类、2类和4类的ROC曲线下的最大面积大于7类，但方法准确度%特异性%灵敏度%AUC%三个具有ROC曲线下的最小面积。如前所述，第三类在形状和亮度上具有高度的不确定性。 1 ~ 7 级的ROC 曲线下面积分别为95.74% 、94.76%、92.19%、96.34%、99.71%、99.23%、93.15%。很好表5中描述了1至7级。五个分类器（Win et al.2020年）Enhanced Deep（Basak etal. 2021年）DCNN和SVM（Plissitietal. 2018年）94.09-97.87 98.89 98.5593.35 98.30 98.20 99.80图2示出了2类和7类的混淆矩阵。八、在混淆矩阵中，每个类的准确性已经被显示。在主矩阵的对角线末端的总体准确率为81.2%，CNN（Plissiti et al. 2018）95.35-IFDL[本研究]97.2098.7998.7099.89M. Benhari和R. 侯赛尼智能系统与应用16（2022）20013311对七类问题的预测误差为98.8%，而对二类问题的预测误差为98.8%。下一小节是关于与其他最先进的方法的比较。5.3. 结果对比分析在前面的部分中分析了所提出的方法的实验结果。为了更准确地评估算法的性能，首先将其与预训练网络、预训练网络与BF分类器进行比较。此外，结果与现有技术方法一致（Abhinaav和Brindha，2019;Nguyen等人，2018）和（Zhang et al.，2018年）已提交。所提出的方法在两类问题中的性能，以及表6中展示的其他现有技术方法。IFDL模型在所有指标中的表现都优于Azur机器学习（Abhinaav和Brindha，2019），特征级联（Nguyen等人，2018），Deep Pap（Zhang et al.，2018 年）和极端学习机 EML （（ Waly ， Sikkandar ， Kadry ，Thinnukool， 2021& 年） Waly 等人， 2021年）。此外，将结果与（Zhang，et al.，2018年，在七个班的问题。此外，IFDL模型也优于Azur机器学习模型（Bhatt等人，2021）、双路径架构（Anita等人，2021）、Deep-cervi X（Rahaman等人，2021）、DCAVN（Khamparia等人，2021）、增强的深度特征（Basak等人，2021）的研究，平均分类率为94.19%，而所提出的方法的平均准确率为98.51%。此外，IFDL模型在特异性方面优于其对应方法，特异性指的是所提出的模型识别正常细胞的能力。IFDL模型的特异性比其他模型高4.4%，平均特异性为94.37%。的IFDL模型检测异常细胞的灵敏度为4.1%，高于相关作品的平均值该模型的灵敏度为98.45，与相关工作具有可比性。IFDL模型的总体性能比Zhang等人报告的深度巴氏检查结果高20%。（2018）的准确度、特异度、灵敏度和AUC分别为98.30%、98.30%、98.20%、99.80%，如图所示。第九章迁移学习模型（VGG19）的效率最低。DeepPAP方法与Deep Pap和IFDL模型竞争。总体而言，迁移学习模型的性能最低，而增强模型表现出更好的性能。在另一个称为（SIPaKMeD）的公共知名数据集上进一步研究了所提出的IFDL方法，结果报告在表7中。SIPaKMeD数据库由4049个Pap涂片载玻片的分离细胞的图像组成（Plissiti等人， 2018年），这是在许多最近的研究中使用。在该数据集中，正常细胞由浅表细胞和副基底细胞组成，异常细胞由挖空细胞和角化不良细胞组成，良性细胞由化生细胞组成因此，分类问题是三类问题。如表7所示，SIPaKMeD上的IFDL模型的结果与最先进的模型具有竞争力。其灵敏度和AUC分别为98.70%和99.89%，优于相关模型。IFDL模型显示出97.20%的准确度，这高于包括五分类器模型（Winet al.，2020）、增强的深度（Basak等人，2021）、DCNN和SVM（Plissiti等人， 2018 年） CNN （ Plissiti 等人， 2018 年）。 IFDL 的灵敏度为98.70%，进一步揭示了模型检测癌细胞的能力。此外，IFDL表现出更好的性能，特异性和AUC分别为98.79%和99.89%6. 结论巴氏涂片图像数据分析中的关键挑战是正确分类和检测柱状细胞的不确定性处理以及避免由于每个类别的低概率而导致的置信网络的样本拒绝。Dempster组合规则的不确定性处理，和模糊加权，以防止数据拒绝，实施。本研究中使用的数据集是在Herlev University Hospital和SIPaKMeD数据集中收集的标准数据集。Herlev数据集SIPaKMeD数据集由4096个Pap涂片细胞图像组成，由技术人员和医生标记。数据增强后的图像进入预先训练好的网络进行特征提取，然后将特征送入带有模糊加权系统的置信网络。通过5倍交叉验证的平均值以及准确性、特异性、灵敏度和AUC指标评价结果。所提出的模型的结果，是兼容的其他国家的最先进的方法。将预训练的CNN方法（Googlenet，res net和Alex net）和BF方法应用于Pap图像的图像分类，并与所提出的模型进行比较。结果表明，在两类问题上，其准确性、特异性和敏感性分别为99.20%、99.75%和99.25%，在七类问题上，其结果是有希望的。ROC曲线下面积为99.01%，显示了我们提出的方法的优越性，在每个度量中，将其他方法的平均值提高到10%。此外，该模型在准确性，特异性，灵敏度和AUC方面优于所有最先进的方法。署名贡献表Mona Benhari：设计架构，实施，写作，Rahil Hossini：主要想法，监督，写作。数据集可在Herleve数据集可在http://mdelab.aegean.gr/下载。SIPaKMeD可在https://www.cs.uoi.gr/~marina/sipakmed.html上获得。竞争利益作者声明，他们没有已知的可能影响本文所报告工作数据可用性数据将根据要求提供引用Singh，Sanjay K. &戈亚尔安佳丽（2021年）。基于堆栈自动编码器的深度神经网络方法用于宫颈涂片图像中的宫颈

下载后可阅读完整内容，剩余1页未读，立即下载