多模态深度学习提升疾病基因关联预测精度

3 下载量 177 浏览量 更新于2024-08-26 1 收藏 412KB PDF 举报
本文主要探讨了如何利用多模式深度学习技术来提升对疾病与基因关联的预测精度。随着现代高通量技术的飞速发展,产生了大量生物信息学数据,如蛋白质-蛋白质相互作用网络和基因本体论数据,这些数据的整合对于疾病的精准预测具有重要意义。传统的方法可能难以捕捉这些异构数据集中的复杂特征,因此,多模态深层信任网络(DBN)作为一种集成模型,被引入到了这一领域。 研究者们提出了一个新颖的方法——多峰DBN(dgMDL),它首先通过两个独立的DBN分别处理蛋白质相互作用网络和基因本体论数据,学习出各自的潜在表示。然后,这两个子模型的潜在表示被融合到一个联合DBN中,形成多模态输入,进一步学习跨模态表示。这种跨模态表示能够捕捉到不同数据源之间的关联,从而更准确地反映疾病与基因的潜在关系。 dgMDL的优势在于其在预测方面的表现,通过5倍交叉验证,dgMDL达到了0.969的AUC值,这显著优于现有的两种最新算法。这表明dgMDL在疾病-基因关联预测任务上展现出了强大的性能。文章还通过分析前10个未知疾病-基因对,进一步证实了dgMDL在发现新疾病-基因关联方面的潜力。 本文的研究成果不仅为生物医学领域的计算预测提供了新的工具,而且有助于科学家们优化实验设计,加速对疾病相关基因的确证过程。多模式深度学习技术在系统生物学中的应用展示了其在复杂生物系统建模和预测中的巨大价值,预示着未来在个性化医疗、疾病预防和治疗等领域有广阔的应用前景。