集成学习驱动的基因微阵列数据分析博士论文:新算法与应用探索

需积分: 10 11 下载量 192 浏览量 更新于2024-08-01 收藏 2.43MB PDF 举报
"基于集成学习的博士论文《多分类器集成系统在基因微阵列数据分析中的应用》由中国科学技术大学的刘昆宏撰写,于2008年4月30日完成,导师为黄德双研究员。论文主要探讨了机器学习领域中的一个重要分支——多分类器集成系统。集成学习的核心思想是通过组合多个基础分类器(或称为弱分类器)来创建一个更强大的整体模型,这在处理复杂且难以解决的分类问题时显示出显著优势。 在论文中,刘昆宏详细阐述了集成学习的基本原理,包括bagging(自助采样法)、boosting(提升算法)和stacking(堆叠)等策略,这些策略旨在通过减少过拟合风险,提高预测性能,尤其适用于基因微阵列数据这类高维、噪声大且类别不平衡的数据集。基因微阵列技术作为现代生物信息学的重要工具,利用其在基因表达水平上的检测能力,对于癌症等疾病的早期诊断和研究具有重大意义。 论文不仅介绍了理论背景,还展示了如何在实际应用中设计和实现多分类器集成系统。作者可能探讨了特定的算法设计,如如何选择基分类器、如何调整集成权重、以及如何处理集成过程中的异质性等问题。同时,刘昆宏强调了论文中所提出的新算法,这些算法可能是为了提高集成系统的效率、准确度或可解释性,为基因微阵列数据分析带来了创新的方法。 此外,论文的原创性和授权使用声明部分表明,刘昆宏确保了所有工作都是独立完成的,除了必要的引用和致谢,论文没有包含他人的未发表成果。同时,作者明确授权中国科学技术大学对其论文享有部分使用权,允许学术界和公众在遵循规定的情况下获取和使用论文。 这篇博士论文深入剖析了集成学习在基因微阵列数据分析中的应用,为解决生物医学领域的复杂分类问题提供了一种有力的工具和理论支持,对相关研究者和实际应用者具有很高的参考价值。"