MLDS集成方法:心血管疾病预测的高精度机器学习模型

0 下载量 178 浏览量 更新于2024-06-17 收藏 1.97MB PDF 举报
本文主要探讨了"多层动态系统集成方法预测心血管疾病的机器学习模型"这一主题。在当前医学信息学领域,利用机器学习技术来预测心血管疾病已经成为一个重要研究方向,因为心血管疾病的早期识别和预防对于降低死亡率至关重要。研究者Mohammed Nasir Uddin和Rajib Kumar Halder,来自孟加拉国达卡贾格纳特大学计算机科学与工程系,针对这一问题提出了一个创新的解决方案。 他们构建了一个名为MLDS(多层动态系统)的模型,该模型基于集成方法,通过层次结构优化现有知识的融合。模型的关键组成部分包括特征选择技术,如相关属性评价器(CAE)、增益比属性评价器(GRAE)、信息增益属性评价器(IGAE)、Lasso回归和ExtraTrees分类器(ETC)。这些特征选择算法有助于减少冗余信息,提高模型的预测精度。 在模型构建过程中,当基础分类器在某一层次无法达到理想分类效果时,引入了K近邻(KNN)算法,用于寻找测试数据的邻域数据点,从而弥补了单一分类器的不足。模型的性能评估使用了来自Kaggle的真实数据集,涵盖了不同比例的训练和测试样本(如50:50、60:40等),并在多种数据集上测试,如克利夫兰、匈牙利、比利时-匈牙利-瑞士-长滩等,展现了良好的分类性能,例如在87.5:12.5的比例下,AUC达到了0.94,这意味着模型有极高的预测准确性。 此外,对比实验显示,与其它五种模型相比,该模型在心血管疾病预测方面表现出显著优势。特别是当数据集分割为87.5:12.5时,模型的准确率高达94.37%,这表明其在实际应用中有很强的实用价值。这个多层动态系统集成方法不仅提高了特征选择的效率,而且通过集成不同的分类器,成功地提升了心血管疾病预测模型的效能,为医疗健康领域的决策支持提供了强有力的技术支持。