类风湿关节炎动态认知地图与集成分类器的研究

129 浏览量更新于2024-01-27 收藏 836KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报类风湿关节炎动态认知地图与集成分类器的研究B. 奇特拉河内敦车治安计算机技术系，Shri Nehru Maha Vidhyala艺术与科学学院，Malumachampatti，Coimbatore，印度Coimbatore，印度阿提奇莱因福奥文章历史记录：收到2020年2020年5月23日修订2020年6月29日接受2020年7月7日在线保留字：风湿性关节炎（RA）自适应神经模糊推理系统深度神经网络（DNN）支持向量机（SVM）粒子群优化（PSO）A B S T R A C T风湿性关节炎（RA）属于慢性自身免疫性疾病，影响关节和肌肉，并可能导致关节结构及其功能的相当大的损害。RA早期诊断对于阻止疾病进展至关重要。在这项技术工作中，引入了具有集成分类器的动态中性认知图与改进的布谷鸟搜索算法（DNCM-ICSA），该方法主要包括数据预处理、特征选择、预测和分类四个步骤。工作的初始阶段包括数据预处理，工作的第二阶段包括基因选择过程，T检验，卡方检验，relief-F和最小冗余最大相关性（mRMR）。接下来，使用集成机制来执行疾病预测，这提高了预测精度。集成机制集成了自适应神经模糊推理系统（ANFIS）和深度神经网络（DNN）的过程。分类器的集成机制是一组分类器，它们的决策通常通过加权平均进行集成，用于新RA示例的分类可避免患者病情发展到严重阶段。最后，DNCM-ICSA算法用于基因分类。最后从查准率、查全率、F-测度和准确率等指标对新分类器的分类结果©2020作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍类风湿性关节炎（RA）是一种病程较长的自身免疫性疾病，主要危害关节。它是一种炎症性风湿性疾病，病程逐渐损害特定和额外的结构，导致疼痛、残疾和死亡（Heidari，2011）。它使关节温暖，肿胀和疼痛。一般来说，手腕和手都会受到影响，身体两侧通常都有相同的关节。这种疾病也可能对身体的其他部位产生影响（伯奇*通讯作者。电子邮件地址：ctchitra@snmv.ac.in（B.Chithra），nedunchezhian@cit.edu.in（R.Nedunchezhian）。沙特国王大学负责同行审查and Bhattacharya，2010）.这可能导致红细胞计数减少，肺部和心脏周围炎症。可能会发烧和疲劳。持续的炎症导致关节的破裂性损伤和几名患者的功能障碍（Gossec等人，2010; Guo等人， 2018年（见图）①的人。炎症是指对应于几种因子的产生的生物过程，从而表明基因表达的变化能够在炎性疾病的不同阶段呈现症状（Chin等人，2015年）。在生物科学方面，其应用涉及基因表达数据分析。在这里，一个常见的问题是寻找一组与特定表型相关的重要基因研究专家利用基因表达数据来决定基因的诱导/抑制是否在过去的几十年中，已经设计了用于RA的诊断和分类的少数条件（Bedran等人，2013）来帮助基因表达数据。然而，及时进行诊断的标准的实施仍在辩论中（Burska等人，2014; Aletaha等人， 2010年）。https://doi.org/10.1016/j.jksuci.2020.06.0111319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comB. 奇特拉河Nedunchezhian/沙特国王大学学报3237图1.一、建议的DNCM-ICSA方法的架构图最近，采用样本的数据挖掘已经获得了很大的普及，并预计将有助于提高涉及的诊断和治疗质量的数据挖掘方法的准确性。从临床数据中获得的信息（在数据挖掘的帮助下）使医生成为一个额外的知识来源，以便在实际工作中做出决策，治疗计划，风险分析和其他类型的预测。疾病诊断是数据挖掘取得巨大成功的应用之一。预测模型的目标是设计一个模型，该模型可以找到预测的类别（Mjaavatten和Bykerk，2010年）。分类的目标，监督学习方法涉及预测的目标类别的数据中的每一个案件中的类别是预先确定的。目前，即使不同的分类算法为特定的数据集选择最佳模型，因为这些经典算法受到一般问题的影响，例如计算复杂度，滑向局部最小值或过度拟合用于训练目的（Whalen and Pandey，2013）。其中一个最普遍采用的计划忘记了这些问题涉及集成学习，主要用于分类器的性能改进。它涉及一个过程，在该过程中，将不同分类器做出的预测进行整合，目的是对新样本进行分类，以提高预测准确性（ Sumana 和 Santhanam ，2014）。集成从分类器获得的结果的嵌入技术在生成具有更好精度的预测中对于几个复杂的分类任务是非常有帮助的。高度流行的合奏技巧有助于平衡合奏的多样性和准确性。此外，这些技术的足智多谋是由于它们能够在几个不同的基础分类器中正确整合准确的预测和正确的错误（Shanmugam和Preethi，2018; Lin等人， 2013年）。在这篇文章中，动态中性认知地图与改进的杜鹃搜索算法（DNCM-ICSA），3238B. 奇特拉河Nedunchezhian/沙特国王大学学报将集成分类器引入到基因表达谱提取中。Entrance技术集成了自适应神经模糊推理系统（ANFIS）和深度神经网络（DNN）的过程。这些集合机制有助于RA疾病的预测。最后，利用集成机制对RA疾病进行预测，提高了预测精度。2. 文献综述Shanmugam和Preethi（2018）研究了一种基于机器学习的嵌入式分析方法（MLEAA），包括两个阶段：学习阶段和预测阶段。在学习阶段，数据处理是在Hadoop中的map reduce框架的帮助下进行的，定义的属性将作用于预测阶段。MLEAA方法的预测阶段包括三种不同的算法，称为 Ada-Boost ，支持向量机（ SVM ），人工神经网络（ANN），并根据投票系统，计算最终的预测值。结果表明，该方法能较好地预测RA。Sharon 等人（ 2019 ）设计了一种 Entrance 算法，如 baging ，AdaBoost和随机子空间，其基础分类器包括随机森林（RF）和SVM，并使用Weka工具在准确度，精密度，灵敏度和曲线下面积（AUC）等评估条件的帮助下进行了训练和测试。初步观察得出的结论是，与其他模型相比，基本分类器SVM提供了更高的分类准确性，并且使用基本分类器RF，Adaboost实现了与用于RA数据集的其他模型相比略好的性能。Shiezadeh等人（2015）介绍了一种Cuckoo Search（CS）-Boost算法，用于Adaboost算法的性能优化，并有助于RA诊断。这些信息是从受影响的人那里收集的，他们被引到设拉子医科大学的风湿病诊所。在下一步骤中，进行数据的预处理.最优类风湿性关节炎疾病预测模型采用CS-Boost分类算法。模型之间的比较分析表明，与其他模型相比，CS-Boost袋的准确度最高。结果表明，肘关节和膝关节、性别、关节数和ESR检测结果对类风湿关节炎的诊断影响最大Bardhan和Bhowmik（2019）引入了一种基于炎症的结构特征分析，在分类的主要步骤中，关节炎损伤膝关节热谱图和其他所有类型的热谱图（无关节炎）均以91%的准确率进行分类。在亚临床阶段的先进RA诊断对医生在减少疾病的影响有极大的帮助。在分类的第二步，RA和非RA分类集成通过提取纹理，形状和频率水平的特征。实验测试表明，所有这些特征的混合降低了RA分类检测的准确性。为了提高分类率，包括基于精度的特征选择过程。Shanmugam和Preethi（2017）设计了一种具有遗传算法（GA）框架的中性认知图（NCMs）。在第一步中，关节炎数据集的预处理是通过双尺度归一化进行的。使用预处理的数据，分类主成分分析（PCA）技术提取的特定功能。特征提取是基于范围分类。它是在具有GA的NCM的帮助下进行的。使用分类数据集可以轻松地预测这种疾病因此，它将有助于对地震的超前预报关节炎的诊断。Salmeron等人（2017）建议采用模糊软计算技术对RA患者进行高级预测认知地图（FCM）。在第一步中，确定了RA诊断的条件在此之后，粒子群优化算法（PSO）和FCM有助于建模这个问题，并计算RA疾病的严重程度。在最后一步中，在伊朗Shohada大学医院进行了在线调查，以评估新引入模型的准确性。Kourilovitch et al.（2014）提出了一种取决于分类标准的RA诊断，包括四个参数，如关节受累、血清学、急性期反应物程度和体征持续时间。这种分类简化了早期RA患者的分类，但诊断需要能够区分RA早期症状和其他病理的高技能专家。Singh等人（2012年）设计了一种采用模糊逻辑控制器（FLC）的RA诊断系统，这是Zadeh制定的模糊集理论的一种流行这是一个非常有用的工具，用于处理模糊和不准确。因此，FLC可以用于对医生的知识进行建模。FLC的性能依赖于其知识库，包括数据库和规则库。已经发现，FLC性能主要基于其规则库，并且在数据库中维护的隶属函数分布的优化是进行微调的过程Pandey等人（2015）展示了用于诊断风湿性关节炎热（RAF）的模糊逻辑系统。模糊逻辑可用于设计决策支持系统（DSS）应用程序，该应用程序可被证明有助于诊断关节炎疼痛的四个不同阶段，例如：相当轻度，轻度，中度和重度。一个知识库，这是设计应用WHO约束条件的RAF诊断，专家指南从尼泊尔获得和一个垫实验室模糊工具箱作为开发系统所使用的工具。Kim和Tagkopoulos（2019）研究了目前用于临床数据研究的机器学习算法的重要综述，这些算法的优点和缺点，以及它们如何能够在流变学领域发挥作用。旨在帮助临床医生和风湿病学家更好地认识机器学习（ML）的本质及其适用的研究目的。Regulatory et al.（2019）旨在评估风湿因子（RF）、抗环瓜氨酸肽（抗CCP）和抗氨甲酰化蛋白抗体一致发生的可能性，以更好地对早期关节炎（EA）患者进行RA分类。Shanmugam和Preethi（2019）设计了一种混合优化方法，该方法取决于迭代二分法3（ID3）和粒子群优化（PSO）的特征分组，用于RA的特征选择和分类。所提出的诊断策略的有效性通过其准确性、特异性、灵敏度、阳性预测值和阴性预测值来证实。3. 拟议方法新引入的工作包括四个重要步骤，包括数据预处理，特征选择，预测和分类。在第一阶段的工作中，进行数据预处理，第二阶段的工作采用 T 检验，卡方检验， relief-F 和最小冗余最大相关性（mRMR）的基因选择。在第三步中，使用集成机制进行疾病预测，该集成机制集成了自适应神经模糊推理系统（ANFIS）和深度神经网络（DNN）的过程。最后，B. 奇特拉河Nedunchezhian/沙特国王大学学报3239x2 X i& c&2Cex2Xic2CjSjgi2S我我DNCM-ICSA算法有助于基因分类过程。采用加权多数函数对单独决策的结果进行3.1. 工作动机RA的早期诊断对于阻止疾病的进展非常关键。因此，提出一种新的类风湿性关节炎的预测和分类模型.数据挖掘方法已采用样本已获得了很大的吸引力，估计有助于提高有关的准确性，通过诊断的手段。3.4.1. t检验t检验基本上是一种统计度量，它验证基因的两个均值是否基本上彼此不同。较大的t值表示不同的组，较小的t值表示相同的组。对于每个t值，都有一个相应的p值。3.4.2. 卡方检验这也是一种众所周知的过滤方法，可用于基因选择过程。 v2-Statistic 值是为每个与类别相关的基因单独计算的（ Jain 和Bhandare，2011）。在计算v2对于每个基因Xi，v2-统计量计算为3.2. 选择专家XX. nx2 Xi c2C-e2非裔美国人的关节炎（RA）解释不佳。外周血单核细胞其中n=x2 Xic2C表示样本或患者数量（PBMC）与RA的放射学危险性相关。20个对照样本（从非属于c类，其中Xi取x的值。所需的频率e x2Xic2C定义为：受RA影响）与10个早期重度、10个早期轻度、10个晚期轻度和10个晚期重度RA样品进行比较。ex2Xic2Cnx2Xiωnc2Cnð3Þ3.3. 预处理技术规范化（Jain和Bhandare，2011）以数据预处理组件的形式用于数据挖掘系统。数据集属性的归一化是通过对其值进行缩放来完成的，目标是它们完全在定义为小的特定范围内，例如0.0-1.0。它主要有利于学习算法。数据归一化的机制（Jain和Bhandare，2011）由z分数归一化组成。3.3.1. Z分数归一化它被称为零均值归一化，其中特定基因G的值基于基因G的均值和标准差进行归一化。G的数据集（RAD）被归一化为RAD0使用下面给出的表达式：其中nx2 Xi表示其中Xi被分配有值x的样本的数量，并且nc2 C指定属于类别c的样本的数量n表示样本总数一旦根据v2- Statistic值对基因进行排序，就可以选择3.4.3. Relief-FRelief-F是一种著名的滤波方法，可以处理噪声和异构数据集。Relief-F背后的主要思想是根据基因的值来评估基因的质量3.4.4. 最小冗余最大相关性（mRMR）该过滤机制选择与目标类具有最大相关性和最小冗余的基因。基因的最大相关性和最小冗余性是在互信息的基础。假设第i个基因gi和类标签c，gi和c的互信息根据下式计算：RA0 1/2RAD-意思是[ð1Þ它们的概率pgi、pc和pgi;c表示如下：D½stdG]XXpgi;c这里std（G）表示基因G的标准偏差，平均值（G）表示基因G的平均值3.4. 基因选择步骤首先，基因选择方法介绍了两个因素：Igi;cpgi;cωlnpgpc4最大相关性方法选择具有最大相关性的最上面的m个基因，其对应于从降序的I^g i; ci的集合获得的类别标签。maxDS; c;D ¼. 1000万美元通过删除不必要的变量来减少搜索空间在监督学习的情况下，最大限度地提高分类器的预测潜力。基因选择是指对输入数据集进行预处理的过程，其目的是评估当前属性，其目的是仅保留与基因相关的数据并去除不相关的基因数据当数据集的维度很大（具有多个属性）时，基因选择很有用流行的基因选择机制（T检验，卡方检验，relief-F和最小冗余最大相关性（mRMR））将在本节中讨论。3.5. 集成模型Entrance是一种机器学习方法，其技术是Meta算法，将各种机器学习方案集成到一个最佳预测模型中，目的是减少方差，偏差或增加预测。与单个模型相比，这种机制有助于在预测方面的优异性能。该研究工作集成了自适应神经模糊推理系统（ANFIS）和深度神经网络（DNN）的过程Entrance技术利用ANFIS和DNN等两种学习技术来实现与Rhetoric X射线照相粗糙度背后的因素¼v2¼ð2Þ3240B. 奇特拉河Nedunchezhian/沙特国王大学学报ð Þ ðÞ我-我f·· ·gBDxi;tiHp我Ri艾碧慈iw1w0我我我公司简从独立地包括的任何学习算法实现。集成本身是一种监督学习算法，因为它可以经过训练，然后实现预测能力。3.5.1. 自适应神经模糊推理系统ANFIS通过使用E-GEOD-64707数据集测试自身来帮助初始隶属函数计算，然后使用反向传播算法或混合学习算法（反向传播和和最小二乘技术）来减小误差。ANFIS Archi-DNN分类模型（Miaa和Miaa，2018）。但是，为了减少L2范数，正则化算法有助于在超参数k的帮助下惩罚较大的权重，用于定义L2范数的相对重要性，以最小化训练数据集中面临的损失。DNN分类模型f hx i包括得到权重函数hw;b，其中w和b代表权重和偏差，使得所需的正则化损失减少（Kukac. 2017）：最小值1XEfxi;tikkhk1 2结构：下面的线条定义了ANFIS系统的五个层（Ziasabounchi和Askerzade，2014）。层1：主层包括模糊化层。这一层中的每个节点i实际上是一个正方形节点，表示为：xi表示输入，Ti则用于k个目标变量数据。超参数限制了正则化算法。正则化算法中使用的第一个函数表示误差函数，而第二个函数称为正则化奥勒艾 ðxÞ;for i ¼1; 2ð6Þ误差表示为. XN。我. 第1页Ol¼l联-2 ðyÞ;for i ¼3; 4ð7Þkhkpj¼0。hj。ð13Þ其中，x和y是指节点的E-GEOD-64707数据集输入i和输入的模糊隶属度形成合成输出。为了计算输入的隶属度，每个节点采用高斯隶属函数。.x-c键1深度神经网络的性能质量预测-诊断模型在预测RA疾病时严重依赖DNN分类模型。通常，具有（L1）个隐藏层的DNN预测模型提供输出函数：OilAixe2ið8ÞY¼/···/XWBBBB其中{c，r}是指参数集。C表示中心L3211 1 2 2 3 3L Lð14Þ隶属函数，r决定隶属函数的宽度这些参数称为前提参数。第二层：第二层包括规则层。该层将E-GEOD-64707数据集输入值作为隶属函数，每个节点乘以E-GEOD-64707数据集输入，并提供指示规则的触发强度的输出。该层获得的结果输出在等式中提供：其中输入矩阵数据X被发送到层作为输入;W n和B n，n = 1，2，. . ，L，表示权重矩阵和偏置向量，相应地，对于n个隐藏层之一;传输n，n= 1，2，.. . L是线性或非线性函数。在n = L处的U函数处的最后一个层被称为输出层，并且下一个层被称为输出层。其它层形成DNN系统和框架中的隐藏层。因此，DNN预测原型可以O21/4w1/4l×1/4l×2/4l300×300×lDiX4×lEiX5有助于使用E-GEOD-64707数据集检测RA疾病在诊断过程中。×lFiX6×lGiX 7i¼ 1; 2;·· ·; 7第3层：这里第i个节点是通过将第i个规则的激发强度除以规则的激发强度的总和来计算的。O3¼w¼WLi¼1; 2;·· ·：：;79第四层：第四层使用自适应节点O4½w i fi 1/2x3x4x5x6x7 x8x 9x 10i¼1; 2;···; 710其中（w）是指层3的输出，并且pi;q i;ri;我不是表示被称为结果参数的参数集第5层：该层由单个固定节点形成在这一层中，结果输出是所有向内信号的总和，如以下3.5.3. DNN和ANFIS的作用采用集成机制进行病害预测，提高了预测精度.集成疾病预测机制集成了自适应神经模糊推理系统（ANFIS）和深度神经网络（DNN）的过程。分类器的集成机制是一组分类器，它们的决策通常通过加权平均进行集成，用于新RA示例的分类。集成技术利用ANFIS和DNN等两种学习技术，与独立包含的任何学习算法相比，实现了更好的预测性能。集成本身是一种监督学习算法，因为它可以经过训练，然后实现预测能力3.5.4. 加权多数表决O5¼y¼Xwi fiwi fiwi fi第一卷;第二卷···; 7分11秒硬投票可以被认为是一种简单的多数表决方案（Seni和Elder，2010年）。在这方面，类别标签y的投票是通过多数（复数）投票完成的，3.5.2. 深度神经网络学习算法形成了深度神经网络（DNN）分类的模型。这有助于修改DNN分类模型的网络中存在的每个神经元单元内存在的线性和非线性传递函数的权重，从而通常最佳地在最小均方误差（MMSE）方面达到所需的设计目标。DNN分类模型一般采用的正则化算法是L2正则化或权值衰减，它是一种直接的函数正则化每个分类器Cj：by<$modefC1x;C2x;· ··;Cmxg15假设三个分类器被集成，其对训练样本进行分类如下：● 分类器1？0级● 分类器2？0级● 分类器3？1类pH-1B. 奇特拉河Nedunchezhian/沙特国王大学学报3241·········！！···！2019-02 - 22ð Þy<$modef0;0;1g <$016通过多数投票，样本将被归类为相对于其他概念的具体权重。因此，Wij是沿着这些路线解释的：0.“3.6. 设计DNCM模型关于我们<>：02域低功耗12个域名大域名-12域名注册我 2结构域中间态ð17Þ中性认知图（Neutrosophic Cognitive Map，NCM）是指以节点、因果关系或确定为边的形式表示规则、事件等感知的中性有向图。模糊认知图的概念对应于两个节点之间的关联/非关联。它是一种逻辑，其中每个逻辑语句都被预测在子集T中具有真理的比例，在子集I中具有不确定性的比例，在子集F中具有不准确性的比例，其中T，I，F指基准或非标准原始子集假设C1;C2;;Cn表示n个节点，节点表示描述性RA概念，可以是系统的特征或因此，在本发明中，一节点C i是表示其中，x k的值为0或1或I（I是指不确定性），并且x k 1表示节点C k存在于RA的较大阶段，并且x k 1表示节点C k存在于RA的较低阶段，并且x k 1表示节点的状态处于RA的中间阶段。考虑Ci和Cj表示NCM的两个节点（它们是RA的概念）。从Ci到Cj的有向边表示Ci在Cj上的因果关系，称为联系。NCM中的每条边都用集合{-1，0，1，I}中的一个数字考虑W ij是指有向边C i C j的权重，W ij2{-1，0，1，I}。如果Ci对C j没有任何影响，则W ij = 0，当C i的上升（或下降）导致C j的增加（或下降）时，W ij = -81，当C i的增加（或下降）导致C j的增加（或下降）时，WWij= I，当Ci在Cj上的结合或结果表示不定式时。边权重为{-1，0，1，I}被称为简单的NCM。取中性矩阵N∈E定义为N（E）=（W ij），其中W ij已知为有向边C i C j的权，其中W i j2{-1，0，1，I}.NCM的Neutrosophic邻接矩阵称为Neutrosophic Adjacency Matrix。采取a1;a2;：：;a n其中，{1，0，1，1}。A称为瞬时状态中性向量，它表示● ai¼0，如果ai处于关闭状态（低）● 如果ai处于开状态（高），则ai¼● ai¼I如果a我是在中间状态（中）用于i/1; 2;···········：;n：考虑C1C2;C2C3;C3C4; ;Cn-1Cn是所遵循的循环，如果Ci被打开，并且如果因果关系在循环中流过边缘，并且如果它再次生成Ci，则动态系统TEM经历循环模式。这对于任何节点ci都成立，对于i = 1，2，，n.这个动力系统的平衡态被称为隐藏模式假设NCM与C1和Cnon，这是为了说明状态向量继续为（1，0，. . 1 ）和该中性态矢量（1，0，，0，1）是称为固定点。如果NCM与中立国达成和解sophic状态向量重记为A1A2AiA1，这个等式被称为NCM3.6.1. 动态中性认知图（DNCM）模型以提高网络化认知模型的能力为目标，提出了一种能够反映系统动态行为和发展非线性关联的动态中性认知图（DNCM）模型对于概念RACi的邻接矩阵N_E_i的值，其相对位置找到其W ij严格地取三个不同的值。NCM中的权重学习等价于连接矩阵中的优化问题，该问题可以使用以下等式解决（十七）、NCM学习集中在邻接矩阵ai的学习上，并且还集中在可用的早期未处理的RA信息上。网络模型的学习方法主要集中在根据专家的启发式信息或可用的历史RA或两者的邻接矩阵的学习。进化DNCM学习方法根据早期信息计算邻接矩阵DNCM进化学习的学习目标是为基于NCM建模的系统生成3.6.2. 改进的布谷鸟搜索算法3.6.2.1. Cuckoo Search（CS）. CS的灵感来自专性育雏寄生，将其数据点放在属于宿主鸟类的集群中。这最小化了数据点被丢弃的可能性，因此提高了它们的再现能力。值得注意的是，许多宿主鸟类与介绍性数据点直接在这种情况下，如果宿主鸟发现数据点不是它们的，那么它们要么放弃它们，要么离开它们的集群，在另一个地方建造新的集群通常，数据点在其宿主数据点之前一段时间填充。首先，本能的动作是通过将数据点盲目地推到簇外来获得宿主数据点。这一行为有助于改善数据点的食物份额CS有助于对这种繁殖行为进行建模，因此可以用于不同的优化问题，并且发现CS 性能可以在 LévyFlights而不是普通随机游走的帮助下得到增强（Tusiy等人，2015年）。如果考虑到自然，动物寻找猎物要么随机或半随机的方式。通常，动物的老化路径实际上是随机行走，因为其下一个移动取决于当前位置/状态和到下一个后续位置的转移概率所选择的方向本质上是基于概率的，并且其建模可以通过分析来完成不同的研究工作表明，一些动物和昆虫的飞行行为表现出Levy飞行的一般特征Lévy飞行基本上是一种随机行走，其中步长按照重尾概率分布。一旦达到了一个更大的步数，从随机游走开始的距离就变成了一个静态分布。3.6.2.2. 布谷鸟搜索实现。聚类中的每个数据点表示一个解，每个数据点表示一个新发现的解，目标是用新的更优的解（数据点）替换嵌套中的更劣的解。简单地说，每个集群包含一个数据点。算法的范围可以增加到更复杂的情况下，其中每个集群包含多个数据点，指示一组解决方案。CS依赖于三个理想规则：每只布谷鸟在某个时间点生成一个数据点，使它成任何随机集群具有更高质量的数据点（解决方案）的最佳集群将被带到下一代●●B3242B. 奇特拉河Nedunchezhian/沙特国王大学学报ð Þ¼ð·················· Þð¼···Þ.Σ.Σð Þ日ðþ Þ我我可用的宿主巢的总数是恒定的，并且宿主可以找到具有概率p[a]的外来数据点在这种情况下，宿主鸟可以丢弃数据点，也可以离开集群，在其他地方构建一个全新的集群。为了简单起见，最终的猜测估计可以使用n个集群的一部分a p来近似，该n个集群被新的集群取代在最大化问题的情况下，与解决方案有关的质量或适应度很少有其他类型的适应度可以像遗传算法中使用的适应度函数那样表示根据上述规则，伪代码给出了CS的基本步骤，如下所示：该技术表现在迭代次数上，以得到优化的解决方案。如果pa的值很小而a的值很大，则算法性能将不是很好，并且导致迭代次数显著增加。在pa的值大而a的值小的情况下，则收敛速度变高，但是可能无法找到最佳聚类。ICS和CS之间的一个主要差异在于pa和a的调整方式。为了提高CS算法的性能，克服pa和a值固定的缺点，ICS算法利用变量pa和a。在素数初始代期间，pa和a的值α必须足够大以使算法改善解向量的多样性。但是，必须降低这些值在过去的几代中，布谷鸟搜索算法的程序开始目标函数f x;x x1;;xd创建初始种群向量。pa和a的值根据代的数目，并定义，其中NI和gn是指总迭代的数目和当前迭代的数目，相应地（Wang等人， 2016年）。n主机群集xi i1; 2;：;nWhile（t MaxGeneration）or（termination criteria）使用Levy flights随机获得一只布谷鸟PaPaGN最大值-NIPaMax -PaminÞ ð20Þ评估其质量/适用性Fia最大有效期：gn21小时如果Fi>Fj，则在n个簇中随机选择一个簇，例如：j用新的解决方案代替j;1美国东北部最小值最大值ð22Þend ifA比例p a 不太好的集群被丢弃，并构建新的;保留最佳解决方案(or具有高适应度解决方案的集群）;对解决方案进行排序并获得当前最佳端，后处理结果和可视化结束当为第i个数据点生成新的解xi t1时，执行Lévy飞行过程。xt1xtaLevyk18ICSA是一个非常成功的处理全球优化，因为它是能够保持稳定性之间的局部和全球的随机行走通过切换限制。通过使用基因值来增加布谷鸟的参数。这增加了分类结果比正常的布谷鸟搜索算法（CSA）。4. 结果和讨论本节说明RA基因样本数据集的拟议技术工作的总体性能比较分析。非裔美国人类风湿性关节炎（RA）放射学严重程度的相关因素解释不清。这项研究工作试图调查基因，在外周血单核细胞（PBMC）中的表达是相关的。其中a> 0指的是步长，而步长又必须与感兴趣的问题中的缩放相关。该产品意味着入口处完成的多个应用程序。定义了一个Lévy飞行，其中步长按照下面给出的概率分布Levyu<$t-k;1k≤ 319<在该步骤中，数据点的连续跳跃/步通常创建随机游走，其遵循具有潜在强尾的幂律步长分布。值得一提的是，实际上，如果一个数据点与宿主的数据点完全相同，那么这个数据点被发现的概率最小，因此适应度必须与解的差异相关联。因此，使用一些随机选择的步长以优先方式执行随机游走是一个更好的想法。4.1.1.1. 改进的布谷鸟搜索（ICS）。在CS中使用的参数pa;k和a有助于算法相应地找到全局和局部扩展的解决方案参数pa和a是用于改变溶液的非常重要的参数向量，并且可以在调整算法的收敛速度方面找到巨大的应用。经典的CS算法利用pa和a的常数值。这些值是在初始化阶段定义的，不能修改与RA的放射学严重程度相关。然后将20个对照样品（来自未受RA影响的个体）与10个早期轻度、10个早期重度、10个晚期轻度和10个晚期重度RA样品进行比较。所有这些样本都是从非裔美国人身上获得的。在这20个对照样品中，总共300个基因表达阵列用于该分析。该检查使用RA基因样本和包括精确度、召回率、准确度和f-测量的度量。在预测分析中，混淆矩阵（表1）使用具有与假阳性（FP）、假阴性（FN）、真阳性（TP）和真阴性（TN）的数量相关联的两行和两列的表。TP被称为正确预测实例为正的数量。FN指的是实例为负的错误预测的数量。表1混淆矩阵。预测正负实际阳性TP FP负FN TN而新一代的人会涌现出来的主要缺点●不●●CB. 奇特拉河Nedunchezhian/沙特国王大学学报3243表2性能比较指标与RA分类技术。技术精密度（%）召回率（%）F测量值（%）准确度（%）SVM77.1878.2079.5066.67模糊C-粒子群算法84.4482.6183.5275DNCM-ICSA94.0293.192.1289.12图二. RA分类方法的精度结果评估。图三. RA分类方法的召回结果评价。FP表示实例为正的错误预测的数量TN代表一个实例为负的正确预测的数量。精确度（P）被称为预期阳性病例的比率，如表达式（23）所示，这些病例是正确的P ¼ TP =0.0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000召回率或真阳性率（TPR）是指正确获得的阳性病例的比例（二十四）TPR ¼ TP =100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000F-测度或平衡F-分数（F1分数）被称为精确率和召回率的调和平均值通过与常数2相乘，它使召回率和精确率均为1时的得分为1。（二十五）●●3244B. 奇特拉河Nedunchezhian/沙特国王大学学报见图4。类风湿关节炎分类方法的F测度结果评价。图五. RA分类方法的准确性结果评价。F-分数¼2 TP= 102TP≤ FP≤ 25分准确性是以正确的预测总数的比例来衡量的它由Eq表示（二十六）准确度：<$TP<$TN=<$TP <$TN <$FP<$FN 26表2提供了这些技术的总体结果以及性能评估的指标。图2示出了对应于三个分类器（诸如新引入的SVM、FCM-PSO和DNCM-ICSA）的精度度量所实现的性能结果。实验结果表明，新的DNCM-ICSA分类器具有更好的分类精度，94.02%，与SVM、FCM-PSO的预测精度分别为77.18%、84.44%.图3示出了对应于诸如novelSVM、FCM-PSO和DNCM-ICSA的三个分类器如从图3中观察到的，揭示了新颖的DNCM-ICSA分类器产生了93.1%的好得多的召回值，而可用的技术如SVM、FCM-PSO相应地产生了78.20%、82.61%的小得多的召回值。图4展示了三种分类技术的F度量比较分析的结果，包括SVM，FCM-PSO和DNCM-ICSA。结果表明，新的DNCM-ICSA分类器产生更好的f-测量结果，B. 奇特拉河Nedunchezhian/沙特国王大学学报324592.12%，而其他可用的技术，如SVM，FCM-PSO的收益率分别为79.50%和83.52%。图图5示出了三种分类技术的准确性比较分析的结果。实验结果表明，新的DNCM-ICSA分类器的准确率为89.12%，而其他现有的技术，如SVM，FCM-PSO的收益率分别为66.67%和75%。4.2. 布谷鸟改良布谷鸟在CS中使用的参数和帮助算法找到全局和局部扩展的解决方案，相应地。参数和是用于修改解向量的非常重要的参数，并且可以在对算法的收敛速度进行调整时找到巨大的应用经典CS算法利用了和a的常数值。这些值是在初始化阶段定义的，在新一代出现时不能修改。这种技术的主要缺点表现在迭代次数上，以获得优化的解决方案。如果的值很小，而的值较大，则算法性能将不太好，导致迭代次数大幅增加。如果的值大而的值小，则收敛速度变高，但是可能不能找到最佳聚类。ICS之间的一个主要差异是并且CS位于方式中，并且a被调整。为了提高每-ICS算法利用了变量和a，克服了CS算法的局限性，克服了使用静态值和a的缺点。在最初的几代人中，和a必须足够大，以使算法改善解向量的多样性但是，这些价值观必须减少在最后几代得到一个更好的和微调的解决方案向量。和a的值根据世代的数量而变化并被定义，其中和指的是总迭代次数和当前迭代次数。还在结果部分中进行了比较，也在附图中。2-5和表2。5. 结论和今后的工作很明显，风湿性关节炎是一种疾病，它降低了生存率，导致更高水平的残疾，降低了人类生活质量。采用集成分类器的动态中性粒细胞定位图与改进的布谷鸟搜索算法（DNCM-ICSA），用于获得区分RA患者与显著对照受试者的基因表达谱。在这项技术工作中，涉及到四个重要步骤，即数据预处理、特征选择、预测和分类。在第一阶段，基因选择指的是对输入数据集进行预处理的过程，目的是评估可用的属性，目的是只保存基因相关信息，删除不相关的基因信息。在下一步中，基因选择通过T检验、卡方检验、relief-F和最小冗余最大相关性（mRMR）来进行。在第三步中，采用集成机制的疾病预测集成了自适应神经模糊推理系统（ANFIS）和深度神经网络（DNN）的过程。最后，利用DNCM-ICSA算法进行基因分类。利用E-GEOD-64707数据集建立的预测模型和分类方法可用于RA疾病的诊断。新分类器的结果是衡量的指标，如精度，召回率，F-措施和准确性。最后，DNCM-ICSA分类器达到了89.12%的准确率，而其他现有的技术，与SVM相比，FCM-PSO的预测精度分别为66.67%和75

下载后可阅读完整内容，剩余1页未读，立即下载