改进属性约简与SVM集成的乳腺癌诊断方法

需积分: 9 0 下载量 77 浏览量 更新于2024-08-11 1 收藏 437KB PDF 举报
"该研究提出了一种结合属性约简和支持向量机集成的乳腺癌诊断决策方法,旨在解决传统遗传算法与支持向量机结合时的属性冗余问题。通过优化适应度函数,该方法实现了属性个数的最小化、区分矩阵可区别属性的最大化以及约简属性对决策属性依赖度的最大化。实验结果在UCI数据库的乳腺癌数据集上显示,与标准SVM算法相比,该方法提高了分类诊断的准确性和敏感性,分类准确度提升至少2%。" 本文是一篇工程技术领域的论文,发表在《计算机应用》期刊2015年第10期,由卢星凝和张莉共同撰写。文章主要关注的是医疗诊断中的机器学习方法,特别是乳腺癌的诊断决策。在传统的遗传算法与支持向量机集成方法中,可能存在属性冗余,影响诊断效果。为此,研究者提出了一种改进的方法,即在属性约简过程中引入三个目标函数,这些函数分别关注减少属性数量、提高属性区分能力和增强决策属性的依赖性。 属性约简是粗糙集理论的一部分,它旨在减少数据集中的非必要属性,从而降低计算复杂性并提高模型解释性。在这个过程中,研究者将上述三个目标函数整合进遗传算法的适应度函数,以指导搜索过程。约简后的属性集合被用于构建多个子集,进而采用支持向量机进行集成学习。集成学习通过结合多个分类器的决策来提升整体性能,尤其是面对噪声数据或复杂模式时。 实验在UCI数据库的乳腺癌数据集上进行,该数据集是机器学习领域常用的公开资源。通过对原始SVM算法的比较,研究证明了新方法在乳腺癌诊断的准确度和敏感性上有所提升。敏感性是指模型识别患病样本的能力,而准确度则是正确分类的比例。实验结果显示,分类准确度至少提高了2%,这意味着该方法在实际应用中可能对乳腺癌的早期检测和诊断提供更可靠的辅助工具。 关键词涵盖了粗糙集理论、支持向量机、属性约简、乳腺癌诊断和遗传算法,这些都是该研究的核心概念。文章的中图分类号和文献标志码分别表示其在计算机科学和技术领域的分类地位和学术价值。 这项工作展示了如何通过改进的属性约简策略和集成学习优化支持向量机在乳腺癌诊断中的表现,为医学诊断领域提供了有价值的理论和技术支持。