图形稀疏化与无监督学习在宏基因组分箱中的应用

0 下载量 54 浏览量 更新于2024-06-18 收藏 21.37MB PDF 举报
“图尔大学计算机博士论文:图形稀疏化和无监督机器学习在宏基因组分箱中的应用” 这篇博士论文出自图尔大学基础和应用计算机实验室(EA6300),由Shivani SHAH撰写,专业方向为计算机科学,旨在探讨图形稀疏化与无监督机器学习技术在宏基因组分箱中的应用。论文的指导教授是VENTURI Gilles教授,评阅人包括LEBBAH Mustapha(巴黎第13大学高级讲师)和TOUZET Hélène(CNRS维勒纳夫-达斯克研究主任)。评审委员会成员包括BOUALIFatma(里尔大学教授)、LARGERON Christine(圣艾蒂安大学教授)、LEBBAH Mustapha、SUBLEMONTIER Jacques-Henri(CEA萨克莱工程师研究员)、TOUZET Hélène以及VENTURI Gilles教授。 论文的作者首先表达了对导师和评审委员会的感谢,特别是他们的耐心和支持,以及在研究过程中提供的指导。此外,她还感谢CEA部门主任、LADIS主任Antony LARUE和Lorene ALLANO,他们为她在实验室进行博士研究提供了机会,并延长了完成论文的时间。特别提及的Stephane GAZUT帮助她接触到了宏基因组学领域,并使她的论文能与相关项目相结合。 宏基因组学是一种研究环境中微生物群落的科学,它不依赖于培养微生物,而是直接分析样本中的所有遗传物质。在本论文中,图形稀疏化和无监督机器学习被应用于宏基因组数据的处理和分析。图形稀疏化是减少数据复杂性的一种方法,通过去除图形中的非重要连接,使数据更易于处理和理解。无监督机器学习则用于在没有预先标记的情况下发现数据中的模式和结构,这对于理解和分类宏基因组数据尤其有用。 该研究可能涉及构建微生物网络,其中节点代表微生物,边表示它们之间的相互作用。通过图形稀疏化,可以揭示关键的微生物关联和核心网络,这有助于揭示微生物群落的结构和功能。无监督机器学习则可能用于聚类分析,识别环境中的不同微生物群落类型,或者预测特定条件下的微生物行为。 这篇博士论文结合了计算机科学的方法与生物学的应用,为宏基因组学研究提供了新的工具和见解,可能有助于推动微生物生态学的理解和环境健康的研究。