SML_SVM:一种基因功能分析的半监督多标记学习算法
需积分: 9 54 浏览量
更新于2024-08-12
收藏 419KB PDF 举报
"这篇论文是关于半监督多标记学习在基因功能分析中的应用,由陈晓峰、王士同和曹苏群共同撰写,发表在2008年的《智能系统学报》上。该研究关注如何从已标记和未标记的基因表达数据中进行学习,提出了SML_SVM算法,通过PT4方法将半监督多标记问题转化为半监督单标记问题,并结合最大后验概率和K近邻方法预测未标记样本的标记,最终利用支持向量机解决单标记学习问题。实验结果显示SML_SVM在yeast基因数据和genbase蛋白质数据上的性能优于基于PT4的MLSVM和自训练MLSVM算法。"
文章详细介绍了半监督多标记学习在生物信息学中的重要性,特别是基因功能分析领域。传统机器学习通常处理单标记问题,即每个样本只有一个标签,但在生物信息学中,一个基因可能有多个功能标签,因此多标记学习成为更为合适的模型。目前的研究焦点在于监督多标记学习,即所有样本的标签都是已知的。然而,半监督学习的情况更为现实,因为实际数据集往往包含大量未标记样本。
作者提出的SML_SVM算法采用PT4方法将多标记问题转化为一系列单标记问题,这有助于利用未标记数据来增强学习过程。接着,该算法利用最大后验概率(MAP)原则和K近邻(KNN)算法来估计未标记样本的潜在标记。这一过程使得算法能够在缺乏完整标签信息的情况下,仍然能够进行有效的预测。最后,SVM作为强大的分类工具,用于解决这些单标记学习问题。
实验部分比较了SML_SVM与两种基于PT4的基线方法——MLSVM和自训练MLSVM,在yeast基因数据和genbase蛋白质数据集上的性能。结果表明,SML_SVM在预测准确性、稳定性和泛化能力上表现出优越性,这证明了该算法在半监督多标记学习中的有效性和实用性。
这篇论文贡献了一种新的半监督多标记学习方法,对于生物信息学中的基因功能预测问题提供了有价值的解决方案,同时也为半监督学习领域的研究提供了一个新的视角和方法。
2017-04-13 上传
2010-05-11 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38572960
- 粉丝: 2
- 资源: 915
最新资源
- Win2K&WinXP网络显示配置常用命令.doc
- 中兴软创笔试题目(华南农业大学考试)
- PCI Express标准概述
- 基于群树结构的IPv6无线传感器网络的组网及路由协议
- 华为技术篇之OSPF协议入门.doc
- 认知无线电网络架构与协议体系
- 网络操作系统Linux(基本命令篇).pdf
- atpcs(c和汇编混合编程规范)英文版
- oracle作业答案
- 解决多种浏览器获取滚动条高度
- 基于FPGA的信号处理系统设计
- VC++动态链接库(dll)编程深入浅出
- Web编程技术-完美版
- saber应用的基础
- Elements of Information Theory 2nd Edition
- skylinesoft体系