网络辅助双聚类揭示癌症新型亚型

需积分: 9 0 下载量 189 浏览量 更新于2024-07-14 收藏 2.82MB PDF 举报
本文献主要探讨了一种新颖的网络辅助双聚类方法(Network-aided Bi-Clustering, NetBC),用于发现癌症亚型。发表在《科学报告》(Scientific Reports)期刊上,DOI:10.1038/s41598-017-01064-0。双聚类是一种常用的数据挖掘技术,它能够同时对基因表达数据中的基因和样本进行分组,识别出在特定基因子集上样本具有相似基因表达模式的生物簇。这些发现对于癌症类型的分类、基因疗法等领域提供了深入洞察。 传统的双聚类方法通常只能发现具有恒定值的生物簇,然而,基因相互作用网络在理解癌症亚型的模式方面具有重要作用。NetBC方法的独特之处在于,它将基因间的相互作用网络结构考虑在内,赋予基因权重。这种方法通过迭代优化残差平方和,来得到反映生物簇特征的行和列指示矩阵,从而实现对基因表达数据与网络结构的有效整合。 具体而言,NetBC的过程包括以下步骤: 1. **网络结构分析**:首先基于已知的基因相互作用网络,分析节点间的连接强度和相关性。 2. **权重分配**:根据网络结构动态赋予每个基因一个权重,强调在网络中关键或有影响力的基因。 3. **迭代优化**:利用赋予权重后的基因表达数据,进行矩阵分解,每次迭代优化求解以找到最优的生物簇划分,即最小化误差。 4. **生物簇生成**:通过优化结果得到的行和列指示矩阵,生成包含相似基因表达模式的样本和基因双重分组,即生物簇。 5. **癌症亚型解读**:通过分析发现的双聚类,科学家可以识别出不同癌症亚型特有的基因表达特征和潜在的治疗靶点。 NetBC的优势在于它不仅考虑了基因表达数据本身,还引入了生物学背景知识,增强了对癌症亚型发现的准确性。这种方法的实施有助于推动癌症研究领域对亚型理解的深化,并可能为个性化医疗决策提供强有力的支持。然而,值得注意的是,尽管NetBC展示了潜在的应用价值,但实际应用时还需要结合大量临床数据进行验证和优化。