没有合适的资源?快使用搜索试试~ 我知道了~
智能系统与应用16(2022)200131使用布谷鸟搜索启用的深度信念网络进行心脏疾病检测Nandakumar P,Subhashini Narayan*Vellore理工A R T I C L EI N FO关键词:心脏病深度学习生物启发算法优化A B S T R A C T心脏病是当今世界上所有年龄段人群中感染率最高的疾病。因此,迫切需要在短时间内准确预测心脏病。针对不同心脏疾病数据集的数据预处理和数据清洗过程,提出了基于汉明距离的特征选择方法。深度学习模型(如深度信念网络)与布谷鸟搜索生物启发算法一起使用,以找到心脏病的准确预测。结果表明,采用布谷鸟搜索算法的深度信念网络取得了良好的性能,克利夫兰的准确率为89.2%,南非为89.5%,Z-Alizadeh Sani为89.7%,Fragrance为90.2%,Statlog心脏病数据集为91.2%。1. 介绍几十年来,世界上的人们面临着各种威胁生命的疾病,其中心脏病在医学研究中已经达到了大量的观察。这是一个明显的疾病,影响许多人在他们的中心或先进的年龄,在少数情况下,它,最后,提示致命的困难。心脏病在男性中比在女性中更常见心脏病的检测心脏病的理想发现在减少健康机会和预防心脏衰竭方面具有重要意义人们所面临的将迅速增加心脏病的一些风险因素是吸烟、年龄、种族、疾病家族史、高血压、高血胆固醇、糖尿病、不良饮食、缺乏锻炼、肥胖、压力和血管炎症。世界卫生组织(WHO)(Li,Hu Gu,2020&)将心血管疾病列为全球死亡的主要原因,17.9每年有100万人离开。 一个相关的威胁,医疗保健组织,如医院和医疗中心,是以适度的成本分配有价值的设施心脏病是当今死亡的主要原因,伴随着COVID- 19的症状。除此之外,冠心病(CHD)是最着名的心血管疾病类型,与世界上1790万人相比,印度的死亡率约为2%。在过去的20年里,研究论文(Saliba等人,2020年)发表的关于心脏病的报告显示,冠心病病例增加了100%,这将导致未来10年全球形势复杂甚至流行。心血管疾病在世界范围内承受着至关重要的压力,占世界死亡人数的30%与CVD和CHD相关的不同心脏病名称是冠状动脉疾病(CAD)、心脏病发作、心力衰竭、心肌疾病(心肌病)、心脏炎症(心内膜炎)、心脏瓣膜疾病、心包疾病、中风和血管疾病(血管疾病),其类型如图1所示,心脏病类型的临床表现如图2所示。其中,我们的研究将集中在心脏病的预测(Almustafa,2020),如肥厚性心肌病(HCM)。输血是用于将血液从一个人转移到另一个人的术语。这是未来影响心脏病患者的主要原因之一。它用于心肺转流(CPB),这会导致医生遵循的手术类型(如手术紧急程度、患者年龄、术前血小板计数和深低温循环停止)导致出血。由于缺乏医生的医疗服务, 需要自动诊断系统(Tuli等人,2020年)以人工智能作为根本概念出现,然后机器学习进入了画面,许多模型专注于各种与人类健康相关的问题。为了在诊断心脏病分类类型时获得更多的计算性能,与传统的传统的机器学习方法,深度学习技术最近出现的生物启发算法,主要用于解决优化问题的支持。深度学习是机器学习的一个子领域,它是世界上一个引人注目的模型,专门用于疾病分类领域。深度学习的概念最早是由Walter Pitts和Warren McCulloch在1943年通过数字模式提出的,* 通讯作者。电子邮件地址:nandakumar. vit.ac.in(N. P),rsubhashini@vit.ac.in(S. Narayan)。https://doi.org/10.1016/j.iswa.2022.200131接收日期:2021年12月31日;接收日期:2022年8月1日;接受日期:2022年9月22日2022年9月28日网上发售2667-3053/© 2022作者。由Elsevier Ltd.发布。这是CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表智能系统及其应用杂志主页:www.journals.elsevier.com/intelligent-systems-with-applicationsN. P和S。Narayan智能系统与应用16(2022)2001312Fig. 1. 心脏病图二. 心脏病的临床表现。依靠人脑的神经网络。在已有模型的基础上,HenryJ. Kelley于1960年提出了反向传播模型,StuartDreyfus于1962年提出了一种更为清晰的基于链式法则的反向传播模型。这两种模型都是低效的,直到1985年才被用于研究。Ivakhnenko和Lapa在1965年努力开发深度学习算法,使用多项式激活函数的概念模型。 后来,在1979年,第一个卷积神经网络被Kunihiko Fukushima使用,并开发了一个名为Neocognitron的人工神经网络,用于识别视觉模式。神经网络和基于深度学习的研究出现于1985年至1990年,1995年Dana Cortes和Vladimir Vapnik发明了支持向量机,1997年Sepp Hochreiter和Juergen Schmidhuber发明了长短期记忆。随着图形处理单元的采用,深度学习的重要进步,以获得更好、更快的结果。深度学习在行业中的影响始于2000年初,随着梯度问题的消失,它通过逐层预训练和LSTM解决。2009年,Fei-Fei Li建立了一个免费的ImageNet数据库,用于存储超过1400万张标记图像,这些图像对训练神经网络非常有用。深度学习在2011年和2012年显著保持了高效率和速度,达到了GPU的速度,并发明了AlexNet,这是一种由Krishevsky等人开发的基于CNN的架构。生物灵感是现代结构,资源和方法的开花。它是由数百万年来生物学进步的适应、程序和拯救中发现的结果所刺激的。这个概念是为了增强生物系统的雕刻和复制,以更好地理解自然的分析结构特征,例如扩展,用于生物灵感设计的进步。生物启发领域始于20世纪80年代初和21世纪10年代,对自然现象的许多类型的研究都受到了有限的支持,但在2020年,已经成功定义的各种新颖算法都有了巨大的增长。复杂优化问题(Martinez等人,2021),例如拓扑结构的设计、调整和超参数的学习,可以使用深度学习优化并采用生物启发算法来有效地解决。诊断疾病从图三. 深度学习历史N. P和S。Narayan智能系统与应用16(2022)2001313许多患者通过收集的数据与不同类别的特定疾病是一个分类问题。对于心脏疾病分类类型,数据将很大,因此在嵌入生物启发算法的深度学习方法的支持下,它将能够在诊断中更准确地进行分类。大多数早期的机器学习技术预测各种疾病类型的准确性适合于小数据集(G'arate-Escamila,HajjamElHassaniAndr`es,2020),对于大数据集,使用生物启发算法的深度学习优化可以更准确地预测它,这导致了将深度学习与生物启发算法嵌入心脏疾病分类的想法。提出的想法主要是使用深度学习方法类型的深度信念网络模型来预测心脏病。这项研究旨在区分各种深度学习算法中的关键模式,以及它们在心脏病风险预测中的性能和应用。生物启发算法还用于在分类算法的帮助下预测冠状动脉疾病。在这项研究中,列出了流行的数据集,并使用各种深度学习技术在心脏病的预测过程中分析了它们的性能。本文的主要贡献如下,心脏病是需要通过早期发现来解决的重要疾病之一。深度学习模型(如深度信念网络)用于检测心脏疾病。生物启发算法进一步用于提高心脏病检测准确性的优化因此,在Cuckoo搜索算法和深度信念网络的帮助下,我们从克利夫兰获得了89.2%的准确率,从南非获得了89.5%的准确率,从Z-Alizadeh Sani获得了89.7%的准确率,从Fragrance获得了90.2%的准确率,从Statlog心脏病数据集获得了91.2%的准确率。与其他机器学习和深度学习模型相比,该模型获得的结果更好第二部分详细介绍了几位作者根据心脏病预后发展的各种结果和方法的文献调查第3节解释了现有方法。在第四节中,提出了利用汉明距离进行数据预处理的方法在第5和第6节中,利用了所提出的深度学习算法的集成分类,并与其他算法进行了比较,以提高心脏病预测的在第7中,所获得的结果与适当的模拟,并从一个著名的数据集存储库中收集的数据集的表进行了描述,最后,在第8中,研究工作的结论与未来的工作建议,实现它在实时应用。2. 文献调查以下调查是基于研究人员用于预测心脏病的各种机器学习和深度学习模型,我们提出的主题是分析其数据集细节如下:Nasarian等人(2020)开发了一种新型混合特征选择算法,称为异构混合特征选择(2HFS),主要用于特征提取。为了实现的目的,他们从Nasarian获得了CAD的数据集,并使用了一些流行的算法,如决策树(DT),高斯朴素贝叶斯(GNB),随机森林(RF)和XGBoost分类器。他们使用的数据集包含与业务相关的亮点,尽管有其他临床特征。他们提出的模型还应用于三个著名的UCI CAD数据集,即特定的Hungarian、long_beach_va和Z-Alizadeh Sani数据集。在未来,测试过程可以通过具有更多方面的巨大数据集来增强。此外,他们计划应用不同的进化算法和集成学习与其他新功能。Abdar(2017)使用了克利夫兰数据集,其中包括303条记录,并发现了一种更好的决策树算法,用于提取预测心脏病或CAD或CVD的规则。他们提出了一个C5.0算法,准确率约为85.33%。预测心脏病的主要原因是属性的组合,如trestbps、restecg、thalach、slope、oldpeak和cp。将来,该模型可用于识别影响心脏病患者的因素。Ann(2019)设计了一个有效的模型,使用几种机器学习和数据挖掘方法来检测CAD。用于此的方法是诊断支持系统(DSS)。此外,他们还实现了两种生物启发算法用于优化目的,一种是遗传算法,另一种是粒子群优化算法。他们还建议在未来使用其他预处理方法而不是数据标准化,例如标准化,方差缩放,分类特征编码和非线性变换。Alizadehsani等人(2013)在Z-Alizadeh Sani数据集上实现了几种算法它们是顺序最小优化(SMO),朴素贝叶斯,用SMO装袋,和神经网络。它可以用来分析数据集。在未来,随着更大的数据集,更多的功能,以及一些更广泛的数据挖掘方法的使用,以实现更好的和非常有价值的结果,在预测或诊断CAD。Alizadehsani、Hossein和Javad(2016)解释了通过支持向量机(SVM)在Z-Alizadeh Sani数据集上检测CAD。实现部分采用两种方法进行特征选择。它们是通过分别为每个动脉选择不同的特征,并为所有动脉选择相同的特征。所使用的两种特征选择方法是平均信息增益和组合信息增益。在未来,数据集的扩展积累了更多的患者细节,以更准确地预测它。在CAD检测过程中,还建议了新的研究领域,如LAD(左前降支)、LCX(左回旋支)和RCA(右冠状动脉)Arabasadi,Alizadehsani,Roshanzamir和Moosaei(2017)开发了一种基于人工神经网络和遗传算法的检测模型,用于预测CAD。数据集来自Z-Ali- zadeh Sani,其中包含303名患者的信息,其中216名患有CAD。在未来,他们提出了一些其他的生物启发算法,而不是遗传算法,通过将其与不同类型的神经网络进行比较来增强所提出的方法的性能。Kivimaüki和Steptoe(2017)已经确定了CVD的进展与成年期的压力效应有关。他们已经确定了许多原因,如高血压、高血清胆固醇水平、糖尿病、吸烟和年轻人本身的肥胖。他们通过街头研究来确定压力在处于严重风险或患有CVD的个体中疾病进展中的作用的证据。Kolukisa等人(2019)评估了独特的分类算法,并提出了一种用于CAD诊断的新型混合特征选择方法为了进行测试,他们从UCI(ML)存储库和Z-Alizadeh Sani数据集中获取了资源。Yamamoto et al.(2020)阐明了心力衰竭(HF)患者的体能与预后之间的关系。他们使用荟萃分析改变了老年心力衰竭患者的评估参数,以获得更好的表现。Gong et al.(2020)已经确定了导致心室充盈或射血功能受损的复杂药物综合征,以及由治疗困难、预后不良和死亡率高定义的心力衰竭特征。根据山西省医学科学院的数据,他们通过建立30天死亡率预测方法,找到了心力衰竭患者的病因。为此,他们使用了反复注意模型,医生可以很容易地根据症状规定药物。·····N. P和S。Narayan智能系统与应用16(2022)2001314D’Alto et al. (2019)此外,他们指出,怀孕和性相关的证据增加了导致冠心病的风险因素。Al-Makhadmeh和Tolba(2019)提出了一种名为(HOBDBNN)高阶Boltzmann深度信念神经网络的物联网医疗设备,用于心脏病预测。该系统或模型也用于在最短时间内发现大数据和识别异常心脏起搏器的过程中。他们还建议,在未来,使用优化技术开发基于物联网的流程,并采用有效的特征选择流程。Mohan,Thirumalai和Srivastava(2019)开发了一种用于预测心脏病的新模型,称为(HEFLM)具有线性模型的混合随机森林。作者还建议使用不同的ML技术组合来加强这项研究,以更好地预测方法来提高心脏病预测的性能。Jin等人(2018)使用电子健康记录(EHR)分析和预测心脏病。他们使用神经网络概念来预测心脏病的可能性,这取决于患者的电子医疗数据。他们还使用了LSTM方法,并将其与其他几种流行的方法进行了比较,如LR,RF和AdaBoost。他们还建议在未来将该模型扩展到医疗保健应用。Mufudza和Erol(2016)使用了基于聚类技术的模型,可以通过泊松混合回归模型预测和识别心脏疾病。基于性别、运动和胸配对因素的水平,他们显示了心脏病预测过程的危险因素。先前在心脏病预测中使用数据集细节所做的工作如表1所示。3. 现行方法从上述文献调查中,我们发现各种机器学习和深度学习模型,如决策树,集成模型,高斯朴素贝叶斯,逻辑回归,随机森林,支持向量机,长短期记忆,人工神经网络用于预测心脏相关疾病。通过这些模型,他们仅对来自UCI机器学习存储库和临床开源数据库的数据集给出了平均85%的准确率。这项工作使用了深度学习模型的方法,如嵌入生物启发算法的深度信念网络,并产生了比现有模型更高的准确性,如90%及以上。通过应用现有类型中不使用的特征选择概念,以优化的方式进一步增强所获得的结果以获得更高的准确性。机器学习技术中的相关问题是数据集的高维性,这导致了许多特征的解剖,这导致了大量的存储需求。出于这个原因,所提出的模型用于存储大量的数据集特征,并以快速的方式执行它们。最后,将所获得的结果与早期的机器学习模型在性能和准确性方面进行了比较。在这项工作中使用的各种研究概念确保它将产生高度准确的结果。4. 拟议方法所提出的架构如图4所示。所提出的方法学工作是用特征选择方法来解释的,随后是用汉明距离进行的数据清理过程,最后,完成重要特征的选择。心脏疾病数据集已被收集和分析,然后输入到我们的清洗模型进行预处理。在数据预处理阶段,采用汉明距离特征选择方法对数据进行缺失值处理、重复数据清理和不必要的属性去除。在我们提出的工作中,汉明距离被用于估计心脏病数据集特征的距离,例如年龄、trestbps、chol、thalach、oldpeak、cp、restecg、slant、ca、thal。下一步是用训练和测试数据交叉验证数据集。训练集用机器学习分类模型进行处理,例如决策表1各种机器学习和深度学习方法准确预测心脏病,并提供数据集细节。作者姓名参考年模型数据集精度侯赛因·M E(侯赛因,乌丁汗,&2021Logistic回归、SVM、DT、RF、NB和KNNCBHS健康基金79%至88%例如,Beunza J等人,2021年)(Beunza等人, 2019年决策树,随机森林,支持向量机器、神经网络和逻辑回归澳大利亚心脏病研究85%Dutta A等人,(Dutta,Batabyal,Basu&阿克顿,2020年)2020年高效的卷积层神经网络国家健康和营养检查调查百分之七十九点五Spencer R等人,(Spencer,Thabtah,Abdelhamid&Thompson,2020)2020卡方特征选择与贝叶斯网络算法奥克兰数据集85%例如,MufudzaC,埃罗尔·H数据集2016(Mufudza Erol,2016&)2016年泊松混合回归模型克利夫兰临床基金会心脏病数据集百分之八十六点七Dwivedi A(Dwivedi,2018)2018人工神经网络(ANN),支持向量机器(SVM)、逻辑回归、K最近邻(KNN)、分类树和朴素贝叶斯Statlog心脏病数据集百分之八十五Orphanou K等人,(Orphanou,Stassopoulou&Keravnou,2016)2015EX趋势动态贝叶斯网络(DBN)模型Stulong 85.5%Tay D等人,(Tay,Poh,VanReeth) &Kitney,2015年)2015年支持向量机(SVM)心血管健康研究(CHS)数据集百分之八十四点八Henriques J等人,(Henriques等人, 2015) 2015远程监护数据模型历史数据集-我的心脏远程监护研究78%和80%Dogan M等人,(Dogan,Grumbach,Michaelson Philibert,&2018)2018症状性CHD的随机森林分类模型和综合遗传-表观遗传算法心脏病研究78%Jin B等人,(Jin等人, 2018年)2018长短期记忆(LSTM)神经网络电子健康记录接收机操作员特性阿明·哈克(Haq等人, 20182018模型K-NN、ANN、SVM、DT和NB(EHR)数据来自现实世界的数据集克利夫兰心脏病ROC曲线下面积AUC&=68.27百分之八十三N. P和S。Narayan智能系统与应用16(2022)2001315见图4。 拟议工作的架构。树,朴素贝叶斯,逻辑回归和支持向量机。测试集使用深度学习模型的优化分类进行处理,例如深度信念网络与布谷鸟搜索生物启发算法相结合。在比较训练数据和测试数据的预测结果与准确性之后, 表64.1.数据集特征选择方法所提出的工作是从数据集特征选择过程开始的,其中收集了不同的心脏数据集,从一个著名的来源。它有大量的特征,其中存在缺失值。因此,为了减少我们选择过程中没有很好组织的特征,我们已经确定了一些缺失值,然后广泛使用特征选择方法来过滤它们。通过汉明距离进行的特征选择如图5所示。收集的心脏数据集用于我们的特征选择和分析过程。最被接受的心脏病相关数据集是克利夫兰数据集。尽管整个数据集有各种各样的亮点,但其中一些通常对一个或另一个预测或分组更重要。阻碍,心脏疾病的发现亮点的一般意义进行检查。例如,性别和年龄是独立检查的,因为这两个因素的影响N. P和S。Narayan智能系统与应用16(2022)2001316闪烁()下一页=()=()- -(一)P vi=1μh()=(+(-))=σb(i0)+W(1)h(1)图五、 基于Hamming距离的特征选择方法元素是主要的研究目标,在大多数疾病状态。4.2.用汉明距离法收 集 的 数 据 集 可 以 使 用 汉 明 距 离 方 法 ( Djatna , HardhienataMasruriyah,2018&)通过计算两个二进制向量与两个向量之间的差值之和来组合和清理。汉明距离可以用于清理数据集,以合并数据的非线性属性。汉明距离也被称为二进制串或位串。一种在字母集上固定长度的表达式的能力,描述了一个单词的图像需要减少到另一个单词所需的变化次数。数据预处理任务如图所示。第六章设A是符号的字母表,B是An的子集,其中集合是n除以A让一个a1,.,a n 和bb1,.,B n B中的单词。汉明距离d a,b定义为a和b可以相差i的位置的数量:a i b i,其中i1,.,n.汉明距离由以下数学模型满足,d(a,b)≥0且d(a,b)=0当且仅当a=b(1)d(a,b)=d(b,a);(2)d(a b)≤d(a w)+d(w b)(3)5. 分类算法神经网络在分类方面的能力的数学原因因此,在我们的工作中,我们使用了深度信念网络(DBN)模型。集成分类的概念也用于我们的工作中,以获得一组分类器,而不仅仅是一个单独的分类器,可以称为分类器的集成(Latha Jeeva,2019&),它将结合它们对不同分类问题的预测。在完成数据集预处理工作以及识别用于心脏疾病分析的重要特征之后,下一步是应用集成分类算法以在预测过程中找到更好的准确性。集合分类的过程是收集训练数据集并将其传输到分类器,然后将其与测试数据集集成。然后,可以通过对它们进行平均和投票来计算组合结果,这是准确预测最终输出的基本方法。深度信念网络分类器完成的任务将在下面的部分中解释。5.1. 深度信念网络深度信念网络(Bengio,Lamblin,Popovici Larochelle,&2007)由Larochelle等人在2007年引入,作为由受限玻尔兹曼机(RBM)的堆叠模块收集的概率生成模型,并提供了传统神经网络的判别性质的替代方案。DBN的主要属性是快速归纳和编码更高要求的网络结构的能力。深度信念网络是利用两种概率并独立计算如何交付收益率的模型。它们是由双重惰性因素构成的,既有无向层,又有协调层。与不同的模型相比,深度信念网络中的每一层都学习整个信息。它可用于识别,聚类,图像处理,视频序列和信号捕获数据,也可用于训练非线性自动编码器。深度信念网络的数学模型如下:具有l个隐藏层的DBN包含l个权重矩阵:W(1),、、、它还包含l+1个偏置向量:b(0),其中w是汉明权重,并且它也表示为B.在纠错码的概念中,来自B的字被转移到噪声信道,假设改变符号。如果B的词之间的名义汉明距离为δ,则可见层的偏置。DBN的概率分布由下式给出,P. h(l),h(l-l) )=exp(b(l)Th(l)+b( l-l)Th( l-l)+h( l-l)TW (l)h(l))(5)该任务熟练地注意到多达δ1的错误和多达δ12的错误。它也被定义为具有相同长度的字符串类型。例如,两个字符串s1和s2在汉明距离中求值P(h(ik)=1<$h(k+1))=σ(bi(k)+W(k+1)h(k+1))(6)作为D(s1,s2),它可以与由以下组成的位置的数量不同,其中, L-2个性鲜明那么两个字符串s1和s2之间的距离是∑|.|.一个单词A在包含显著符号0的字母表上的汉明权重w(A)是距离d(0,b),其中零是所有.(T):,i零字。对于以向量表示的线性类型的代码,空间,则汉明距离由权重确定:d(A,B)=w(A-B)(4)对于实值可见单位,替换为v<$N(b(0)+W(1)Th(1)β-1),(8)对于易处理性σx1/ 1exp x具有β对角线来自训练的DBN的权重可以用作初始化的:,i我是阿吉(N. P和S。Narayan智能系统与应用16(2022)2001317见图6。 数据预处理。N. P和S。Narayan智能系统与应用16(2022)2001318我∈ []DNN的权重h(1)=σ.b(1)+vTW(1)),(9)h(l)=σ(b(l)+h(l-1)TW(l)),男(10)然后,在这一点上,通过应用反向传播或其它判别模型来调整全部负载,以提高整个网络的效率。DBN的当前趋势和应用如表2所示。6. 生物启发优化算法最优化问题是所有工程学科中最受关注的数学问题。它主要用于寻找最佳可行解决方案。目前,一个活跃的研究课题是广泛分布在世界各地的优化问题。它既可以是确定性的,也可以是随机性的,并且具有解决需要大量计算工作的优化问题的模型。生物灵感是现代结构,资源和方法的开花。它是由适应、程序和拯救中发现的结果所刺激的,这些结果在生物学上已经发展了数百万年。生物启发领域始于20世纪80年代初和21世纪10年代,对自然现象的许多类型的研究都受到了有限的支持,但在2020年,已经成功定义的各种新颖算法都有了巨大的增长。自然和生物活动的概念激发了许多解决问题的启发算法的诞生。人工进化的批判性思维特征被纳入选择互动中,它包括两种基本方式。1)表型的评估,其给出定量得分,也称为适应值,以及2)乘法运算符,其与具有高适应值的表型相比,产生大量的基因型副本。这些算法通常分为进化计算和群体智能算法。 进化计算tation是一个用来修饰算法的习惯用法,适者生存的本质群体智能是一种习惯用法,用于为分散的问题解决者美化算法,这些问题解决者受到蜂群或bug飞地和其他物种居民的集体习惯的协调团队智慧的热情。这导致在所提出的工作中添加生物启发的优化算法,用于预测心脏病,以产生更大的功效。在过去的几十年里,生物启发计算(Kar,2016)已经成为人工智能研究最多的学科之一。生物启发算法已被广泛用于加速深度学习模型的学习过程,特别关注深度信念网络。类似地,生物启发的生物学(DelSer等人,(2019)经常表2提出了当前趋势和应用中使用的深度学习模型用于基于DL模型预测规定接近最佳的行动,完成现在称为可操作的数据科学。由于深度学习系列模型的参数数量巨大,未来的职位预计将迅速增长,该系列模型最近正在探索采用生物启发技术作为替代方案。在现有的文献中,大多数研究人员已经进行了其他传统的方法,如PCA,卡方检验,相关系数等的特征选择过程中,在我们提出的工作,当与其他方法相比,汉明距离的方法,可以产生更多的增强的特征选择过程。布谷鸟搜索算法用于解决数据分类中的类不平等问题。在(Mohsin,Li Abdalla,2020&)中,作者提出了一种基于Adam-Cuckoo搜索的深度信念网络(Adam-CS-based DBN)用于数据分类。首先,由DBN分类器执行分类,并使用基于Adam的布谷鸟搜索算法进行训练,并使用诸如准确性、灵敏度和特异性的度量来实现更好的性能。 在(Li等人,2021),采用自适应混合模拟退火布谷鸟搜索算法(SA-ACS)模型,并将其应用于深度信念网络(DBN)。他们还指出,SA-ACS-DBN算法用于提高训练速度和收敛精度。在(Gampala等人,2022),作者使用了深度信念网络方法,并增强了托管布谷鸟优化方法,以获得COVID-19诊断中的最佳超调参数。与卷积等其他模型相比,该模型具有更好的性能神经网络与社会模拟优化(CNN-SMO)和使用贝叶斯的支持向量机分类器优化算法(SVM-BOA)。基于上述文献,对于数据的分类,深度信念网络的布谷鸟搜索在其问题陈述中表现得更好。因此,我们在工作中使用了布谷鸟搜索支持的深度信念网络,以准确的方式检测心脏病。6.1. 布谷鸟搜索算法布谷鸟搜索(Yang Deb,2014&)是一种重要的基于种群的优化算法,由Xin-she Yang等人增强,在2009年。它的工作原理是通过涂抹他们的卵子在不同的喂养鸟类的庇护所。布谷鸟搜索的灵感来自繁殖行为的帮助,也适用于几个优化挑战。从自然启发的领域来看,布谷鸟搜索也是一种技术,主要用于解决不同工程领域中的几个优化问题。在求解全局优化问题时,通过引入切换参数,可以保持局部和全局随机游动之间的平衡。由于对开关参数的研究较少,将开关参数固定在25%,因此,深度学习模型用方法应用优势精度无法通过该方法进行评估。它被广泛应用于语音识别、作业调度、神经计算和全局优化等领域。基于知识的和RBM(Yu Liu,&2020)深度信念网络,SVM,KNN,和HMM(Movahedi,Coyle&Sejdic,2018)加工粗糙度预测与知识发现脑电信号它保留了过程的物理知识,并提供了良好的预测它为EEG数据提供了更好的数据建模和任务分类70-80%91.31%布谷鸟搜索算法的数学模型如下:CS方法用以下三个理想化规则来解释:1 每只布谷鸟依次产下一个蛋,然后把蛋扔到一个随意挑选的巢里。2 最好的家庭与顶级口径的鸡蛋将延伸到以下年龄。3 可访问的宿主家庭的数量是固定的,并且宿主可以找到可能性Pa0, 1的外来者蛋。对于这种情况,宿主鸟可以丢弃蛋或离开家在另一个区域组装新家(巢)基于这三个原则,CS的基本步骤可以是N. P和S。Narayan智能系统与应用16(2022)2001319=-()⊕总结如下:当生成新的解x(t+1)时,比如说,布谷鸟i,L′evy飞行由方程定义。(11)如下,x(it+1)=x(it)+αLevy(λ)(11)密度函数(PDF),其中t。 在大多数情况下,α1和λ1.一、5.L'evy-flight具有增加人口差异的独特性质,这使得算法能够有效地跳出局部最优。下式(13)被计算为Levy随机数,其中x(it)是布谷鸟的当前位置,α是根据搜索空间的维度调整的步长和正常数Levyλ×u|1 / λ|1/λ(十三)是条目乘法,λ是levy指数。上述方程本质上是随机游动的随机方程。随机步长取自L′evy分布在Eq. (12)如下所述,其中u和ν都是标准正态分布,则在等式中定义(14)如下,[γ(1+λ)×sin(π×λ/2)]1/λ=Levy(λ)u=t-λ,(1λ≤ 3)(12)<γ。((1+λ)/2)×λ×2(λ-1)/2)(十四)其中λ是定义概率其中,γ是标准伽马函数,并且θ是用于N. P和S。Narayan智能系统与应用16(2022)20013110图第七章提出的模型(DBN + CSA)的流程图表示。N. P和S。Narayan智能系统与应用16(2022)20013111收敛总之,该算法的全局搜索能力,提高了利用随机游走与Levy飞行,避免其局部极小。它也被视为产生更成功的结果,特别是对于单峰和多峰基准函数。在自然界中,许多生物和令人毛骨悚然的爬虫寻找食物在一个不规则的或半任意的方式以下的性质勒维飞行,其中的进展长度是适当的一个实质性的后续PDF。由于L'evy航班有无限的手段和变化,一些新的安排将位于周围的最佳安排有一个时间t,和其他人将设置远离目前最流行的安排。该组件允许CS比利用标准高斯相互作用的不同计算更有成效地调查查询空间,尽量不被捕获在附近的最优值附近。深度信念网络和布谷鸟搜索算法之间的联系如图所示。第七章与GA和PSO类似,CS是一种基于种群的算法。第一个优点是随机化更有效,因为步长是重尾的,允许任何巨大的步长。第二个优点是它比GA和PSO具有更少的调整因子,使其在应用于更广泛的优化问题时可能更灵活。此外,每个巢可以表示一组解决方案,允许CS被用作元种群方法。最初的CSA,通过结合特定问题的知识,可以分为三种。一种是构造性算法,另一种是局部搜索算法。第三种是借鉴其他算法的结构进行杂交。在这项工作中,第三类是通过适应DBN分类和CSA用于最终调整的参数,所提出的目的是检测是否存在心脏疾病。布谷鸟搜索算法的步骤如算法17. 结果和讨论这部分展示了结果及其讨论的各种心脏病数据集,已被实验的拟议模型。在所提出的模型中使用的心脏数据集是南非心脏病数据集、UCI克利夫兰、匈牙利、瑞士和VA长滩、Statlog、Z-Alizadeh Sani、Fra心脏和心力衰竭数据集。首先,将具有各种特征的数据集加载到weka工具中进行数据预处理。特征选择方法用于识别和分类的权利也用于分类数据,并且分类值的选择被转发,使得聚类最有可能承担数据预处理工作。在我们提出的工作中使用的分类模型是深度信念网络,这是深度学习模型的类型。训练样本使用传统分类器进行分类,而测试样本则由优化的分类器(如嵌入布谷鸟搜索算法的深度信念网络)完成。结果表明,深度信念网络优于所有其他模型。表4和表5显示了深度信念网络模型的性能评估指标结果,表6-表图图8-14表示使用深度信念网络模型的性能的图形表示。7.1. 混淆矩阵混淆矩阵是一种表表示,用于描述包含真或假的分类类型模型的性能。它很容易理解,但分析起来很复杂,有一系列的特征。对于心脏疾病预测过程,存在两种预测可能性,即是或否,其表示疾病是否存在。用于混淆矩阵分析的基本术语是真阳性(TP)、真阴性(TN)、假阳性(FP)和假阴性(FN)。表3显示了使用混淆矩阵的建议工作中使用的性能指标。真阳性(TP):用于正确识别预测结果。假阳性(FP):用于识别代表I类错误的预测结果不正确。假阴性(FN):用于拒绝代表II类错误的错误结果。真阴性(TN):与正确拒绝结果的FN相反。有一些不同的性能指标可以使用混淆矩阵来计算。它们是准确度,精确度,召回率和F1分数。准确性对于数据集中存在的几个实例的正确分类是决定性的。计算精度的数学公式表示为,分析过程的特征。上述心脏数据集中常用的一些特征是年龄、性别、最大心率、thal、类型A、家族史、吸烟、肥胖、静息血糖和血清精度TP+TN(15)TP+FN+FP+TN胆固醇它们中的一些不用于选择,因为它通过增加指示错误识别的时间复杂度来降低性能。汉明距离用于特征选择过程,其通过清洗过程最小化数据,算法1布谷鸟搜索算法。步骤:A1.启动进程A2.初始化随机人口A3.获得杜鹃不均匀的厚尾A4。计算健身A5.在不均匀的A6中选择庇护所或巢穴。如果适应度小于嵌套解,则A7。将其替换为其他最佳解决方案,否则A8。以巢为解A9. 对于步骤7和步骤8,然后执行放弃分数最差巢并通过重尾创建A10.存储当前最佳解决方案A11. 如果没有。如果nest的值小于或等于最大迭代次数,则找到最佳nest,否则转到步骤3A12。 结束该过程精度用于从给定数据集预测正值,它广泛用于信息检索。计算精度的数学公式表示为,见图8。性能评估结果的图形表示. Cleve-land数据集.=N. P和S。Narayan智能系统与应用16(2022)20013110==()=见图9。 性能评价结果图示-匈牙利语- 数据集。见图10。性能评估结果的图形表示-统计日志数据集。见图11。性能评估结果的图形表示-瑞士数据集。见图12。性能评估结果的图形表示-南非数据集。图十三. 性能评价结果的图形表示- Z-Alizadeh Sani数据集。见图14。性能评估结果的图形表示- Fra-100数据集。表3使用混淆矩阵的性能度量。类别是否真阳性(TP)假阴性(FN)精密TPTP+FP(十六)无假阳性(FP)真阴性(TN)召回率(灵敏度)也广泛用于信息检索,利用比例数据预测总阳性百分比。计算召回率的数学公式表示为,特异性用于预测完全真阴性与实际阴性的比例,特异性TN(18)TN+FP召回灵敏度TPTP+FN(十七)F1分数用精确率和召回率的调和平均值表示。它同时处理误报和漏报N. P和S。Narayan智能系统与应用16(2022)200131111=这在不平衡数据集上产生良好性能。计算F1评分的数学公式表示为,F评分2次(精确度和召回率)(19)(精确度+召回率)7.2. 讨论数据集我们工作中使用的心脏数据集由几个记录组成,例如南非心脏数据集有462条记录,UCI Cleveland有297条记录,UCI Statlog有270条记录,UCI Z-Alizadeh Sani数据集有303条记录,UCI Fracket心脏数据集有4240条记录,心力衰竭数据集有1000条记录。所有这些记录都已用于实施部分的K折交叉验证。从结果中,我们得到了不同深度值的深度信念网络的错误率的性能值。此外,错误检测的效果进行了评估,包括错误分类阶段。表4的分析表明,网络深度值的增加降低了错误率。不同心脏数据集的准确性以深度值和错误率示出。基于深度值的变化,降低了错误率,并大大提高了精度。对于Cleveland数据集,在深度值为4时达到89.2%的最大准确度。匈牙利数据集、瑞士心脏数据集和z-Alizadeh Sani数据集在深度值为5时达到了89.7%的相同准确度,匈牙利和z-Alizadeh Sani的错误率
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功