没有合适的资源?快使用搜索试试~ 我知道了~
医学信息学解锁21(2020)100408基于和声搜索和模拟退火算法Tawseef Ayoub Shaadaa,Rashid Alib,*a计算机科学工程系,Baba Ghulam Shah Badshah大学,Rajouri,JK,185234,印度b印度北方邦阿里格尔市阿里格尔穆斯林大学计算机工程系,邮编:202002A R T I C L EI N FO保留字:乳腺癌和声搜索模拟退火机器学习分类器K-SVMA B S T R A C T本文提供了一种杂交精简算法结合和声搜索(HS)和模拟退火(SA)称为和声搜索和模拟退火(HS-SA)的精确和准确的乳腺癌。 此外,一个改进的基于小波的轮廓波变换(WBCT)系统的特征提取探索,以获得感兴趣的区域(ROI)的亮点,允许性能优于其他标准方法。在挖掘出的特征空间中,投影HS-SA算法旨在减少特征维数,并聚集在前所未有的特征集。支持多种核函数的支持向量机分类器用于分类,它是由所选择的功能,其表现与传统的机器学习分类和优化技术形成对比。现实的计算机辅助诊断(CAD)的学习机制的挑战,评估其结果。它检查了两个不同的乳腺钼靶摄影数据集i)基准BCDR-F03数据集和ii)本地钼靶摄影数据集。试验再现,实证结果和可衡量的检查同样表明,提出的模型是实用,有利于乳腺恶性增生的治疗。研究结果表明,所提出的CAD框架(HS-SA+核SVM)优于不同的表征准确性程序(局部乳腺摄影数据集的准确性为99.89%,基准BCDR-F03数据集的准确性为99.76%99.41%(对于本地乳房X线摄影数据集)和99.21%(对于参考BCDR-F03数据集),同时保持特征空间仅限于七个特征子集,并且计算先决条件尽可能低是谨慎的。1. 介绍当乳腺癌的恶性生长影响到体细胞时,体细胞呈指数变化,不可避免地变成肿瘤的大多数乳腺癌疾病尤其发生在产乳器官的节段,称为小叶,以及与小叶相连的通道,最后到乳头。乳腺包括脂肪组织、结缔组织和淋巴组织[1]。与每年22%的新病例相比有200多种癌症,但乳腺癌影响全球妇女的速度和速度是无与伦比的。根据国际癌症研究机构(IARC)的报告,2017年美国女性中预计有2,52,710例新发乳腺癌,63,410例新发乳腺原位癌,40,610例乳腺疾病死亡[2]。乳腺疾病占所有恶性肿瘤病例的23%,占所有恶性肿瘤病例的14%发达国家和发展中国家的恶性增长消亡。据估计,仅在2010年,全世界女性中就有超过160万例新发乳腺癌病例[3]。2011年,近170万人成为乳腺疾病的目标。在美国,每天分析527例新的乳腺疾病病例,每天有110人死亡。在2016-2017年的见解中,根据美国癌症协会(ACS)的说法,预计美国将出现许多新的乳腺恶性肿瘤病例。它包含了埃及所有恶性生长类型的18.3%[4]。如果一名妇女活到85岁,她有八分之一的可能性(12%)在她生命中的某个时候患上乳腺疾病,因为乳房恶性生长的风险显着增加,随着妇女年龄的增长,很少注意她的家族血统印度女性最容易被乳腺癌所激怒,其中最大的恶性增长,迫使人们同样倾向于对发展中国家的风险。事实研究表明,死亡率为每10万名妇女12.7人,与年龄相平行-* 通讯作者。电子邮件地址:tawseef37@gmail.com(T.A. Shaanxi),rashidaliamu@rediffmail.com(R.Ali)。https://doi.org/10.1016/j.imu.2020.100408接收日期:2020年4月28日;接收日期:2020年7月25日;接受日期:2020年7月25日2020年10月22日在线提供2352-9148/© 2020由Elsevier Ltd.发布这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表医学信息学期刊主页:http://www.elsevier.com/locate/imuT.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004082调整后的比率高达每10万名妇女25.8人[5]。在2015-2016年,女性受到恶性乳腺增生的影响,印度医学研究委员会(ICMR)的调查结果表明,通过率为50%。巴基斯坦每年有超过4万人因此死亡。在伊朗,恶性肿瘤是继冠心病和乳腺癌之后的第三大死因,占所有癌症的24.6%患乳腺癌的女性平均年龄为49.6岁[6]。疟疾是全世界的主要死亡原因,2012年有820万人死于疟疾每年的疾病病例数将从2012年的1400万上升到未来二十年的2200万是正常的[7,8]。因此,控制恶性生长和制定长远的避免计划至关重要。在此期间,应该更加重视疾病的早期诊断,以延长病人的寿命。及时发现乳腺癌对耐力有重要意义,特别是在低工资国家,那里的资产非常紧张,晚期疾病的诊断使负担更加麻烦。乳腺X线摄影筛查渐近妇女是一种行之有效的非侵入性技术,降低死亡率从乳腺恶性肿瘤多达30%。40岁以上的女性应根据ACS的建议每年接受一次乳房X光检查。通常,乳房X光检查发现类似恶性肿瘤的东西,导致假阳性(FP)。此外,放射科医生可能会错过高达30%的乳房恶性肿瘤,这取决于乳房的厚度[9]。根据世界卫生组织(WHO)的报告, 通过早期分析来治疗疾病的早期诊断,如果早期诊断成为现实,就可以阻止乳腺癌的发生。改善恶性肿瘤预期各种技术,旨在使个人能够遵循预防疾病的成功策略。所有这些令人信服的因素已经说服了大量的研究在过去的几十年里,专注于计算框架的进步,以帮助医生破译放射图片。这些CAD框架增加了当前药物的空间,填补了当局的数据热点,并扩大了正确发现真正感染(如乳腺癌)的可识别证据的步伐[10]。尽管如此,在写作中发现的检查对于厚的和非厚的质量都使用类似的策略和设置,而这些系统可以逐渐适合特定类型的厚度。磁源成像(MRI)、自我和临床乳房检查、超声和乳房X线摄影是用于恶性乳房生长的一些筛查策略[11]。最准确和最直接的乳腺癌鉴别系统是乳房X光检查。胶片乳腺X线摄影被先进的数字乳腺X线摄影所取代,后者使用出色的机械化微钙化和肿块是最常见的刺激乳腺恶性生长的异常医疗数据分析改变了传统的医疗保健服务于新近以证据和治疗为基础的机器学习和模式识别领域诞生不久。对生物医学数据(MRI、CT扫描、PET、US、乳房X线摄影等生物医学图像,以及EEG、ECG、EMG等生物医学信号)的分析导致了自动化和智能CAD系统的设计,这些系统有助于在症状从外部可见之前早期、准确和精确地诊断疾病随着人工智能技术的发展,数据驱动的智能分类方法已被应用于乳腺癌诊断,如朴素贝叶斯[12-[34混合算法[442011年,B. Zhang等人[47]提出了一种具有拒绝选项的随机子空间级联,用于显微镜活检的分类图像. A. E. Hassanien和T. Kim在2012年[48]熟悉了一种混合方法,该方法结合了模糊集,脉冲耦合神经网络(PCNN)和支持向量机的奖励,并结合基于小波的特征进行最佳癌症分类。2013年,V. Balanica等人[49]提出了四种新方法,用于挖掘乳房X线摄影中感知到的乳腺病变的推测特征。参考文献[50]等中的作者展示了一种快速正交搜索(FOS),该搜索提供了有效的迭代方法来计算逐步回归,并且可以从动态对比度增强磁共振图像计算的一组动力学和纹理候选特征中选择具有预测值的特征。L. Taifi等人。[51]在2014年提出了一种基于同态滤波和小波的预处理方法,用于去除乳腺X线摄影图像中的不规则性。W. Sun等人[52]计划了一种三阶段半监督学习(SSL)方法,用于改进具有未诊断数据的计算机化乳腺癌分析的呈现。2015年,N. P. P'erez等人[53]提供了一种新的特征选择方法(称为uFilter),该方法改进了Man-n在2015年,作者等人[54]提出了一种新的基于局部能量的形状直方图(LESH),作为评价乳房X线照片中不规则性的特征集。 2016年,H. Kong等[55]提出联合稀疏判别分析(JSDA),直观了解乳腺癌的主要因素,以提高诊断和预测的准确性。2017年,W. Sun等人。[56]开发了一种基于图的半监督学习(SSL)方案,使用深度卷积神经网络(CNN)进行乳腺癌诊断。2018年,S. Liu等人[57]利用贝叶斯网络(BN)建模方法进行乳腺癌建模。2019年,L. Tsochatzavik等人。[58]在乳腺癌的计算机辅助诊断(CADX)的背景下研究了深度卷积神经网络(CNN)。Q. Xu等人[59]在2019年开发了一种基于CNN网络的CAD,旨在对光学断层图像中的乳腺肿块病变进行分类。T. A. 2020年,Shaanxi等人[60]提出了一种基于LUPI的乳腺癌CAD框架,该框架使用特权信息,通过重新定位PI来增强基于单模态成像的乳腺癌本研究旨在根据切除肿瘤的特征诊断乳腺癌。分类器是数据挖掘方法的重要组成部分,其性能的好坏完全依赖于特征提取和选择。估计量的呈现,无论是在学习速度,泛化维度或直接向前,进步的分类和聚类方法的基础上建立的功能的正确选择,许多方法被应用于乳腺癌的诊断在最近的文献。然而,近年来可用数据量(特征和记录)的大量增加已经限制了旧的方法,因此,Meta分析方法采用特征选择,并在数据挖掘领域增加了其使用的特征数量。目前的研究压缩了主要的特征空间,以减少SVM训练的计算成本,并保持并行诊断的准确性。为了提取有益的信息和诊断肿瘤,HS-SA搜索和支持向量机(K-SVM)算法的混合开发。HS-SA算法被用来区分良性和恶性肿瘤的不可见的设计明显,并发现临床乳腺癌诊断的最佳功能。从训练阶段的原始21个特征子集中挖掘出7个肿瘤特征子集。尽管K-SVM减少了尺寸,输入特征空间的一致性,具有较高的预测精度。保持。从计算时间的角度来看,所提出的策略通过减少输入特征的数量来减少训练时间。据我们所知,所提出的HS-SA-SVM混合策略与最佳特征子集的融合是新颖的,并被视为在后述方向的新努力。1.1. 我们的贡献/动机下文概述了这项工作的承诺T.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004083=我们采用了一种改进的基于小波的轮廓波变换(WBCT)的特征提取策略,使性能优于其他标准方法。具有核函数的SVM在具有不同水平的训练/测试速率的基准和局部恶性数据集我们提出并实现了一种新的混合优化算法融合和声搜索(HS)和模拟退火(SA)称为和声搜索和模拟退火(HS-SA)算法的早期CAD诊断乳腺癌。建议的HS-SA计算排除了最佳的局部粘连称为过早收敛的搜索和谐。这增加了探索,特别是在执行开始时,以避免局部最优并产生最佳理想特征。最后,采用不同核函数、不同参数整定、不同训练测试数据分裂率的HS-SA-SVM组合,实现分类。这项工作还比较了所提出的技术在乳腺癌数据集和本地收集的乳腺X射线摄影数据集上的表现。最后的数值结果表明,所有的HS-SA计算性能优于标准的SA和HS。1.2. 组织其余的纸被筛选为:第二部分以相关文献的形式重点讨论了乳腺癌诊断中使用的优化和元启发式策略。第3节描述了基准和局部乳腺摄影恶性肿瘤数据集。此外,数据预处理、SVM核化、性能参数估计等工作都需要占用相同的空间.第4节“性能分析和讨论”中详细分析和讨论了探索性的行动过程和数值结果。最后,在最后一部分的第5节中,除了对未来方向的讨论之外,还完成了全面审查。2. 文献综述本节讨论了信息技术在卫生服务中的作用的相关研究工作。文献综述将主要集中在优化乳腺癌检测的信息技术上。在过去的几十年里,通过滋养和创建智能系统来提高集群性能,计算机辅助诊断(CAD)研究在恶性乳房生长中掀起了一场台风[61乳腺癌的各种CAD诊断测试表明,与放射科医生相比,检出率从4.7%提高到19.5%。不同的自动化方法已经发展并用于研究乳房X线摄影中的异常[66在任何情况下,对于校准,现有CAD创新的根本缺点是大量的误报[70]。当典型的乳房区域被标记为可疑时,发生乳房X线照片转换的假阳性,并且随后经历不必要的乳房活检的扩展。很大一部分研究主要集中在低特异性(高假阳性率)上。这通常是自动疾病诊断的论据。与产生良好恶性生长发现结果的新肿块位置计算相反,存在一些研究以努力减少FP [71Karabatak和Murat [75]认为贝叶斯特征,是乳腺癌生长分组最简便、最显著的技术。作者利用加权朴素贝叶斯模型作为参考的事实,贝叶斯方法不能计算回概率。利用粒子群优化小波神经网络(PSOWNN),作者等人[ 76 ]研究了另一种特征 方法 为 的位置 的 乳腺 变化 从乳房X光检查异常该方法的核心是提取乳腺X线图像的纹理和能量信息,并通过一个实例分类器对可疑区域进行分类。通过使用从乳房X线摄影筛查收集的216张乳房X线照片的真实临床数据库并利用受试者工作特征(ROC)曲线进行性能测量来检查潜在策略。 结果表明,该方法的ROC曲线下面积为0.96853,敏感性为94.167%,特异性为92.105%。基于分组和属性过滤,参考文献[77]等人提出了一种加速KNN计算的智能方法。它结合了基于坚定不移的质量系数的改进通过这种方式,工作提出的承诺是三个叠加:(i)类实例的聚集所提出的方法的后效超过了大多数已知的分组系统,在所考虑的乳腺癌数据集上,正常f-测量超过94.00%穆罕默德·R [78]。等人对579例乳腺恶性肿瘤患者的临床病理质量进行了重复预测(重复率为19.30%)。在学习中体现了包围圈该方法在整个交叉验证倍数和保持检验倍数下的最低灵敏度、特异度、精确度和准确度分别为77.00%、93.00%、95.00%和85.00%,优于其他测试分类器。Zeng等[79]探索了粗糙集和支持向量机(SVM)的混合模型用于乳腺疾病可视化,平均准确率为91.00%。Kimet等人使用了归一化互信息指数技术[80]对于特征确定和SVM,COX比例风险回归模型和ANN分类器,样本量679例(重复率28.6%)。的最佳分类器的敏感性、特异性和曲线下面积分别为89.00%、73.00%和0.85。尽管事实上,他们的框架的可衡量的强度是令人满意的-工厂(功效=89% N 80%),I类误差超过适当范围(α0.17 N 0.05)[80]。[81]等人的作者提供了一种称为群优化(DFO)的群流线化程序的使用,以开发一种系统,其中理想地创建了底层种子集中和限制。前馈神经网络(FFNN)分类器在利用灰度共生矩阵(GLCM)和灰度等级线性矩阵(GLRLM)方法提取纹理高光时,以反向传播算法为支持,将图像分为友好和危险两类。使用DDSM数据库评估所提出的方法的能力,所提出的基于pixel的程序与利用ROC检验的其他区域发展策略的对比所完成的结果。在300张图片的训练和测试中,该框架的敏感性达到98.10%,特异性达到97.80%。拉科斯·坎丹 等人[82]提出了一种依赖于交错阈值的最优化的自通用划分方法,其中使用群改进方法创建理想限制。实证结果支持增强的自我多功能的蜻蜓优化后,检查其实力的真实和临床图像。和声搜索算法(HSA)启发了论文[83]等人的阈值方法,该方法使用任意示例作为图片直方图内追求空间的竞争者排列,以考虑所使用的目标词卡普尔人的策略这一目标是在一个实验结果表明,该方法对乳腺恶性肿瘤的分割具有较高的精度。参考文献[84]等人提出了另一种BC识别方法,该方法依赖于置信加权投票方法和提升集成技术,他们将所提出的CWV-BANNSVM模型与提升ANN(BANN)和两个SVM结合起来,利用理想参数。应用技术的展示使用一些众所周知的测量进行评估,例如特异性、灵敏度、精密度、FPR、FNR、F1评分、AUC、Gini和······T.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004084)(×精度所提出的模型可以选择改善传统的计算机计算应用于BC发现的呈现,达到100%的准确度在参考文献[85]等人中结合GA和RF算法用于感测BC,作者声称,他们的新的集成策略,当应用于14 BCE,有99.48%的最佳预测准确率。Turabieh和Muhanna [86]利用ANFIS策略和GA识别BC预测的最佳亮点。最高预测精度为71.00%。对于编程的乳腺恶性肿瘤发现,Fadzil Ahmad等人[87]提出了一种基于遗传算法的人工神经网络分类器(即GA-MOO-NN)的多目标增强。它是对值得注意的元素子集和理想工程系统的同时探索。结果表明,用本文提出的目标混合比进行计算,得到了最佳和正常的阶次精度,分别为98.85%和98.10%。参考文献[88]等人提供了一种利用模糊基础框架和GA的混合物并将其应用于沙特阿拉伯乳腺癌数据库的自动化乳腺癌技术另一种用于分类问题的遗传优化神经网络(GONN)算法是由A.Bhardwaj和A.Tiwari[89]同时为订单增强其设计(结构和重量)的对交叉和变异算子进行了与传统算子不同的修饰,减少了它们的破坏性思想。该算法对50-50、60-40、70-30个训练-测试分区的分类准确率分别为98.24%、99.63%和100%,对10倍交叉验证的分类准 确 率 为100%。Xue等人。[90]通过采用不同的初始化和评估机制PSO(4-2)提供了一种改进的PSO技术用于特征选择,并声称已达到94.74%的准确度。当熟悉预训练的卷积神经网络(CNN)与新任务时,使用转移学习的微调策略,利用端到端的图像表示学习,作者[91]等人提出使用多标签图像分类的函数联合学习。在四个基准数据集CBIS-DDSM,BCDR,INBreast和MIAS上证明了该方法的充分性,与其他常用基线相比,获得了更好的结果参考文献[92]等采用了模糊ART与一些元启发式推进算法的混合,发现了模糊ART的参数,并赋予其数据管理功能尽管如此,展览会通过利用进化优化技术从根本上得到了改善。该计算的最佳执行是97.80%的准确性和98.92%的特异性。Muslim等人[93]提出一种半定向学习算法,标签数据的要求。两个基准癌症数据集从UCI体现为评估所提出的方法。实验结果表明,该算法是可行的,有效的,在乳腺疾病的程序化诊断中有着广阔的应用前景。进一步的相关工作确实可以从Ref. [94E Blokh [97]等人。该模型在从Assaf Harofeh临床中心(Zerifin70,300,以色列)和Rabin临床中心(Petach Tikva,以色列)收集的数据集上进行了评价,并且表现更好。作者在Ref。[98]等。在仔细评估WBCD和卢布尔雅那乳腺癌复发数据后,使用等渗分区并考虑其价值和适用于临床乳腺癌发现R. Acharya等人[99]提出了一种将三种乳房X线照片特征化为特定普通、种类和疾病的相关方法。前馈结构的神经网络分类器和高斯混合模型(GMM)的两个分类器用于馈送提取的特征。该惯例利用了来自高级数据库的360名受试者进行筛查性乳腺X射线摄影(DDSM),包括这些分类器对典型、良性和恶性生长乳腺疾病的敏感性和特异性指标均达到90.00%以上。参考文献[100]等提出了基于SVM的分类器与贝叶斯分类器和ANN的相关性,用于预测和分析乳腺恶性生长感染。本文对所有调查分类器的执行细节进行了比较,并实现了最高性能。作者[101]等人熟悉一种有组织的SVM模型,通过考虑训练集中的束结构来决定每个乳腺摄影区域是普通的还是有害的。对DDSM数据集进行了探索性评估。就ROC曲线下的区域而言,有组织的SVM实现了更好的性能测量作者[102]等。提供了一个杂交DPSO计算,准确性为98.71%,敏感性为100%,特异性为98.21%。在参考文献中。[103]等,在快速划分岩心的过程中,尝试了四种不同的分组计算方法。融合了K均值、模糊C均值、竞争学习神经网络(CNN)和高斯混合模型,在阴影空间中进行聚类,并结合通用的灰度阈值。与Zielona Go 'ra地区医院合作获得的50名患者的500张准确病例医学图像对这些技术提出了挑战。 所得分类准确率约为96- 100%。类似的工作可以从参考。[1043. 材料和方法3.1. 数据集在这项研究中,我们讨论了用于估计的基准和局部/原发性乳腺癌数据集3.1.1. 数据集描述BCDR-F03 [108]数据集由344名女性的736个活检证实的病变组成,转换为736个分区(正常情况下每个溃疡1张图片),对临床材料和图像描述符进行计数。数据集中的每条记录包含33个属性 从x1,... x33。所有的疮都包括肿块或不同肿块的混合物违规行为。由于放射科医生的基本BI-RADS准备是通过活检结果(良性与恶性发现)来完成的,因此它是该类的双重数据集。内容NaN(不是数字)表示缺失的记录。每个具有512 *512像素的共同和奇怪区域从来自数据集的乳房X线照片中修剪。如中所示,由512 *512像素组成的图像足够大,可以包含通常观察到的致癌区域并删除多目标高光。对于随机图片,此512 *512测试集中于异常区域。最后,数据集被任意地异化为具有类似大小的肿瘤和非肿瘤样本的训练和测试子集。的 当地 乳腺 恶性肿瘤 数据集 包括 160 乳腺肿瘤160个不同病人的乳房X光照片所有病例均具有活动性和病理性。图片大小为580 775,PNG格式,包含88种威胁性(异常)乳腺肿瘤病例和72种非肿瘤病例(正常)。地面真值表格由放射科的放射科医师手工绘制。遵循机构审查委员会(IRB)批准的惯例,批准所有受试者进行人体成像研究。所有患者均标记了接受乳房X线摄影检查的知情同意,并进行了实际调查。每一处损伤的活检完成后,医生都会公布组织病理学结果。3.2. 数据预处理这是为了通过消除具有较少或根本没有贡献的数据来装饰数据以获得最佳结果而丢弃的。T.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004085∑我()下一页(-)()=()下一页()下一页∑∑3.2.1. 数据准备知识渊博的放射科医生承担了手工肢解和标记确定准备中的基本事实的工作。250个切口,包括所有基本组织,被分配到手工分析。原始图像上的皮肤、器官和肿块在另一层中以不同的灰度等级分开,以比较原始图像。每个切割的目标像素处有超过20,000个图片正方形,这些图片正方形是通过手动解释创建的,然后将其放入准备集和测试集。使用制备套件进行模型制备,并使用测试套件进行评价。3.2.2. ROI选择肿瘤及其直接环境因素被用于测试分类器。肿瘤掩模或簇具有与用于布置包围区域的RF图片类似的大小,在适应疼痛区的区域设置剩余字段从肿胀的掩模中扣除第一个掩模,制造包围肿瘤区域的覆盖物(估计了用于表征参数中间值的五个感兴趣区域(ROI):肿瘤区域、肿瘤和环区域、环区域、肿瘤中线上方的环区域3.2.3. 预处理/增强和分割/特征提取预处理阶段有它的工作在喧嚣和古代杀戮,从而使无瑕疵和完美的数据质量的结果。丢失的副本已得到妥善处理。起初,数据包含的年龄几乎没有任何情况下,如1002年,2002年,这是不可想象的,并取代了允许的年龄扩展值。2-D中间滤波器,其中输出图像中的每个像素点具有围绕图形像素点比较的5 × 5区域的平均估计,并且零替换图像边缘,用于噪音重新分配,其最终使用基于物理的乳房X线照片增强策略来升级。利用基于小波变换的轮廓波变换(WBCT)算法提取ROI特征,并将其标准化后作为矢量特征存储在数据库中。 基于分水岭的分割算法获取Rithm,用于从乳房X线摄影中提取ROI边界限制虽然SVM主要用于包含两个类的数据集,并且其基本思想是找到两个类之间的完美判别式,但是同样存在用于多类数据集的方法:一对所有(OAA)和一对一(OAO)。OAA方法需要k个分隔符用于k-a类排列,使得每个分隔符用于从每个不同的类中隔离一个类。而OAO方法使配对向量机为每一个可以想象的类(一个双重向量机的每一个可以想象的混合类),在OAA计算通常被视为k *k 1/ 2配对向量机。3.3.1. 核化在大多数情况下,这两个类不能被孤立。为了将直接学习算法扩展到非线性情况下的功能,引入了基本概念,即第一数据空间可以被变换为数据集可分离的高维元素空间。通过这种映射,以下结构的判别函数:如覆盖模式可分割性假设所示,在信息空间中直接不可分割的设计可以修改为一个空间位以直接区分,只要过渡是非直接的,并且片空间的维数是令人满意的[111]。非直接支持向量机的基本思想是利用非线性映射φ将向量从信息空间勾勒到高维分量空间,然后通过核化AHC来区分信息结构,然后继续使用直接支持向量机进行设计排序。尽管如此,在线性地图上的那一点pingφ通过耗尽核函数k(Xi,x)来执行,符合Mercer因此,s-SVM的精简问题可以计划如下:g ( x ) =wTφ ( x ) +b=αiφ ( Xi )Tφ ( x ) +b( 1)i∈SV其中,输入空间中的xT x被表征为φ(Xi)-Tφ(x)。由于φ(Xi)是通过选择核K Xi,xj φ XiT φ xj来斜标定的,所以绘制φ Xi的有效公式不需要确定。 因此,优化问题可以有这样的架构:最大化∑αi-1∑∑αiαjyiyjK(xi,xj)( 2)图片. 从乳房中的ROI提取的一些特征图形图像在单独观察时是不重要的,但与其他特征结合,它们可以对分类有意义。用于消除误报和分类为以便:ni=1nn2i=1nj=1在特征选择过程中使用HS-SA优化算法选择良性或恶性。HS-SA算法的最佳特征选择过程以算法3的形式给出。3.3. SVM分类基于Vapnik-Chervonenkis(VC)假设和结构风险最小化(SRM)标准的最终原则它具有较强的内在能力,从而决定数据测试的特征。采用支持向量的概念和后续的分类器可以扩大类之间的过渡,促使优越的投机能力和高阶精度。此外,凸二次规划通过赋予全局最小值来武器化显著有利位置,从而避免陷入局部最小值。它已经证明了它的价值的最佳分类策略的变化的应用。如果数据具有线性可分性特征,SVM将超平面标记为具有最大间隔的超平面,或者将其映射到具有m个突出测量的其他空间以直接区分。在两类学习任务中,SVM的目标是从训练数据中找到最佳排列并识别出两个类中的个体。在有大量超平面的情况下,SVM认为具有突出类边缘的超平面是分离的理想选择甚至0 ≤αi≤C,αiyi=0(3)i=1在αi的最佳值已经产生之后,决策函数取决于以下公式的符号:g(x)= αiyiK(Xi,x)+b(4)i∈SV当一切都完成后,任何满足默瑟条件的正半明白能力都可以是核函数。核函数的特征在于与二元向量在某个扩展元空间中的点结果有关的容量。在SVM中可以利用许多部分容量。SVM中最常用的核函数包含以下内容:线性:x,x′><多项式(齐次):(γx,x′>)d多项式(非齐次):(γx,x′>+r)d• 其中d是多项式阶数。T.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004086·=)=()()•()(∑=()∑)((+)∑0,否则,∑̂̂()下一页∈==(%),NPV=,F1=2×(%)(13)∑(,)=(、 ),、 =... ||+的||.=(/||)(- -一种||. Pî==(%)RBF(高斯):exp(-γ|x-x′|)22σ2被降级阶级的支持率以一票之差扩大。最后,投票最多的类决定案例特征。如果支持向量较少,则核函数具有良好的表示,并且将测试数据放入其对于γ>0,有时使用γ 1/ 2σ2进行参数化。其中σ是控制高斯核大小的约束。sigmoid:(tanh(γx,x′>+r))(5)<该核通过方程K Xi,xj与变换α Xi相关联α Xi。αxj。值w也在畸形空间中,w iμ yiα i Xi,x.与用于分类的w的点积可以再次由核心概念来表示,即,W. α(x)=iμ iyiα i(Xi,x)。然而,总的来说,并不存在一个值w′,使得w。α(x)=K(w′,x).推论1.如果核空间中聚类Sin的均值和协方差矩阵的猜测分别为:μφ=1Σφ(x),以及,(6)S想要的群体有效。在所提出的计算机化分析框架中,我们探索了关于高斯函数和多项式的不同途径,名义核总之,为了隔离数据集,选择训练数据X、Y,理解增强问题,并且确定参数ai、w、b。在这一点上,底层的给定信息向量X信息指数由SG N W 的估计排序。X*b 。 使用从底层初步数据集获得的测试数据集尝试确定的支持向量的暴露。3.4. CAD质量评价评估了乳腺癌诊断的投影CAD方案的效率,以确定其质量是否与底层方法相结合(图11)。①的人。3.4.1. 基于区域的评估方法我们在检查中使用了六个基于区域的评估指标,例如准确性、灵敏度、特异性、AUC、PPV和NPV,以量化图像分割执行量。|S|x∈S∑φ=1∑(φ(x)-μφ)(φ(x)-μφ)T,SS很好 它们可以基于物理上和物理上的覆盖面积,自然产生的结果。接受肿瘤的划分,如图所示。 1.,比较术语的含义如下:S|x ∈ S|x∈S安排的权利记录数/绝对记录记录 现在,数据集的特征正确性是最优w在由训练数据图桥接的空间中欺骗。从推论1,我们可以将w记为:估计利用条件:∑|不|估定|P| +|N|w=αiφ(xl),.(七)t=1准确度(T)=i=1,ti ∈ T,(10)|不|其中,xl∈ λ是系数。 通过使用数据报告中的wassess(t)={1,if classify(t)=correctclassification,描述,我们可以获得优化问题的内核。|+| N||N|最小值l=1S. t. (Klα + b)≥ 1-Kl + KlPi||K πα||,xl ∈ Pi,-(Klα + b)≥1-xl+Nj||KNjα||,xl ∈ Nj,||α|| ≤γ,γ 1≥ 0。(八)Kl表示核格拉姆矩阵K中的第l行,其中元素满足K i jk Xi xjij1PN KPi1PiKPIe PivT,其中e|Pi|是一个长度为|Pi|. KPi是核矩阵其中T是要分类的数据项的集合(测试集),t T,t。c是项t的类,classifyt返回分类器对t的分类。灵敏度中文( 简体)TP+FN特异性中文( 简体)TN+FPPPV=TPTN精度×重新调用在聚类Pi和所有训练模式中,即KPi(s,j)=k(xs,xj),s = 1,.,|Pi|,j = 1,..,|P|+的|N|. VPi是矩阵KPi的平均向量,TP+FPTN+FN精确度+重新调用|VPi(j)=∑k(xs,xj)/|Pi|,j = 1,..,|P|+的|N|. KKANNJ是有预谋的corre-3.5. 拟议方法xs∈Pi关于KPi这使得核化的SVM可解析,因为结果无疑支持优化问题在数据图像之间的内积的关系中被完全阐明,只有在非线性约束严格地与二阶锥规划问题相关联的情况下。SOCP问题的求解可以产生最优解扰超平面。通常,只有一个百分比的系数αl不为零的数据点被称为SVM的。通过以下结论函数:Lf(x)=sgn(αiK(Xi,x)+b)(9)i=1对于一个对所有情况的新情况的分组是由冠军采取一切方法完成的,其中具有提高产量工作的分类器分发该类。对于一对一的例子,安排是通过投票的最大成功来完成的,其中,每个分类器将出现分配给两个类中的一个,此时,T.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004087和声搜索是一种令人难以置信的元启发式算法,具有高滥用能力,但如果最优局部附近靠近一个或多个初始生成的解/和声,则会承受不适时的intermixing仓促收敛的巨大障碍。因此,为了驱逐这个图1.一、 质量评估缩写的定义。T.A. Shaanxi和R. 阿里医学信息学解锁21(2020)1004088∈1 2Nn遏制,本文提出了一种新的算法,这是依赖于混合的两种策略的和声搜索和模拟退火称为HS-SA获得各自的兴趣点。Harmony Search(HS)是Geem等人于2001年开发的一种元启发式算法,已应用于广泛的研究领域[112]。从模拟退火的动机来看,HS-SA算法甚至承认有问题的安排,而不是工具是变量的值。HS算法以目标函数为界,寻找某个问题的最佳状态,就像管弦乐队演奏者调节和声以创造良好的平衡一样。HS算法有一个和声存储器(HM),用于保存任意创建的和声向量的初始种群,其结构以矩阵形式表示x1x1...X1存放在由参数温度控制的和谐存储器中12Nx2x2... X2容忍有问题的规定的可能性逐渐减少,通过降低温度参数在执行过程中,以提高能力的前年龄计算和滥用的后代进行调查。3.5.1. 和声搜索与模拟退火1 2N. . .[啊。. .. . .xHMSxHMS. *HMS](十四)对这些算法的介绍进行了说明。3.5.1.1. 和谐搜索。和声搜索(HS)是一种创新的Meta启发式算法进行进化算法[112]。该方法在交通指挥、多目标流线化、民用水资源分配系统规划、电力建筑负荷调度、排班问题、群聚、基本结构、顺序、地下水显示、生命力保留调度、地下水建模、节能调度、桁架设计、车辆路径和特征选择等多个应用维度上都有其可行性和重点,并给出了一些实例。算法1.和声搜索算法(HSA)。有关使用协调制度的详细检讨,请参阅 参考文献[113,114]。HS的伪码表现为算法1。在伪代码中,H表示潜在的排列或一致性,rand[0,1]是一个一致传播的不规则数生成器,rand_ int(1,HMS)在1和HMS之间生成一个系统的任意数,其中HMS是和声记忆的大小,D是问题的维数。在创建被称为Hi的新一致性的第i部分时,来自HM的某个当前友好性的第i段以似然HMCR被指定给它(步骤10),或者随机产生的评价以似然1-HMCR被分发给它(步骤15)。在步骤12中,Hi随似然概率PAR略微改变。HS中的评价工作是在属性子集空间中进行全面而彻底的追求,直到找到最佳的特征融合。在HS中,过去最好的解决方案保存在和谐记忆(HM)中。假设变量为乐器,其中xi(i = 1,2,., HMS)是第n个变量的指定解,HMS是HM尺寸,??是变量的个数HMS通常设置在50到100之间因为HM获得了最好的结果;因此,当新值的结果好于HM中的最差结果时,其关联中的HM改变发生。有三种方法可以手动选择新值:由HM指定,从可想象的解决方案范围内任意指定,或者由称为音高调整的驻留区域搜索指定。HM的分类通过HM考虑率(HMCR)实现。音高调整,HM成员的突变,有一个发生率,称为 音高调整率(PAR)。随机搜索和音调调整防止了早期的连接并保持了解决方案的多样性。每一行??-方程(14)中的一维实向量提供了称为“和谐”的解决方案。因此,矩阵X中的列数基本上显示了解的维数每一行的适应度函数的值保存在矩阵X的最后一列中。和谐存储器大小(HMS)是耗尽的滋养HM中的答案向量的数量函数f(x)探索每个向量的适应度函数的输出值。在HS中,最初,完成所有HM行,并且考虑每行的适应度函数的值并将其存储在HM矩阵X的最后一列中。因此,在光中,重要的重复或时间冗余的量被完成,整个HM被检查,并且对于每条线,每个部分的适当激励由HS参数设置之后,如果适应度函数的激励优于HM中存在的最极端最差解,则HM中的旧值中的替换发生最终,在适应度函数中收获最优值的解被优选为最高级可达解。在HS中,任何值都可以随机手动选择值。随机化肯定是用于扩大解决方案的种类。因此,通过随机重新初始化或音高调整操作,通过存储器考虑操作,从HM中的要素中产生新的申请人和声。最后,HM通过对比新的候选和声和HM中的最差和声向量新候选向量在其优于最差和声向量的情况下替代HM中的最差和声向量。上述过程被重复进行,直到满足特定的最终标准。基本HS算法需要三个基本阶段:HM初始化,新和声向量的即兴创作,以及HM的更新(见表1)。基于上图,下面的表2列出了音乐术语和优化之间的一些普遍相似之处。每个乐器或音乐家类似于每个决策变量,每个乐器的音高对应于决策变量的值,所有乐器形成的新和声对应于优化问题的解,和声的美学品质对应于解的目标函数值。在练习之后迭代地精炼音乐和声
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功