基于输出不一致测度的极限学习机集成基因表达数据分类算法研究

0 下载量 38 浏览量 更新于2024-08-26 收藏 566KB PDF 举报
"基于输出不一致测度的极限学习机集成的基因表达数据分类" 本文提出了一种基于输出不一致测度的极限学习机(ELM)相异性集成算法(D-D-ELM),用于基因表达数据分类。该算法克服了单个ELM用于数据分类时性能欠稳定的缺点,通过输出不一致测度对多个ELM模型进行相异性判断,根据ELM的平均分类精度剔除掉相应的模型,最后对筛选后的分类模型用多数投票法进行集成。实验结果表明,D-D-ELM能够以更少的模型数量达到较稳定的分类精度。 极限学习机(ELM)是一种单隐层前馈神经网络,它具有快速学习和高泛化能力的特点,广泛应用于模式识别、数据挖掘等领域。然而,单个ELM模型在数据分类时可能存在性能欠稳定的问题,为了克服这个问题,本文提出了基于输出不一致测度的ELM相异性集成算法。 输出不一致测度是指两个或多个模型之间的输出结果存在差异的可能性,通过输出不一致测度,可以对多个ELM模型进行相异性判断,从而剔除掉性能不稳定的模型。该算法首先对多个ELM模型进行输出不一致测度,根据测度结果对模型进行排序,然后根据ELM的平均分类精度剔除掉相应的模型,最后对筛选后的分类模型用多数投票法进行集成。 实验结果表明,D-D-ELM能够以更少的模型数量达到较稳定的分类精度,证明了该算法的有效性。该算法可以应用于基因表达数据分类、生物信息学、模式识别等领域,具有广泛的应用前景。 知识点: * 极限学习机(ELM):一种单隐层前馈神经网络,具有快速学习和高泛化能力的特点。 * 输出不一致测度:两个或多个模型之间的输出结果存在差异的可能性。 * 相异性集成算法:一种通过输出不一致测度对多个模型进行相异性判断的算法。 * 基因表达数据分类:对基因表达数据进行分类,以获取生物学信息。 * 集成学习:一种通过多个模型组合的方式来提高分类精度的方法。 本文提出了一种基于输出不一致测度的ELM相异性集成算法,用于基因表达数据分类,该算法克服了单个ELM模型在数据分类时性能欠稳定的缺点,具有广泛的应用前景。