ModuleFind:基于网络模块性的蛋白质序列聚类算法
需积分: 9 155 浏览量
更新于2024-08-12
收藏 316KB PDF 举报
"这篇论文是关于基于网络模块性的蛋白质序列聚类的研究,主要探讨了在结构基因组学和功能基因组学中如何检测蛋白质的远同源性。论文提出了一种名为ModuleFind的新算法,该算法利用网络的模块性原理来优化蛋白质聚类,旨在识别具有相似结构和功能的蛋白质超家族。实验在SCOP(蛋白质结构分类数据库)的超家族层次上进行,结果显示ModuleFind算法的聚类结果与分类基准高度一致,并表现出较高的F-测度值,即精度和召回率的综合评价指标。"
在这篇工程技术领域的论文中,作者关注的是蛋白质序列分析的一个关键问题——远同源性探测。远同源性是指蛋白质之间虽然序列相似性低,但可能存在共享的结构和功能,这对于理解蛋白质的功能和进化关系至关重要。传统的序列比对方法可能无法检测到这种远距离的同源性,因此需要更先进的方法。
论文中介绍的ModuleFind算法是一种创新的聚类策略,它将蛋白质网络视为一个由节点(蛋白质)和边(相互关系)构成的复杂系统。模块性是衡量网络中节点是否倾向于聚集在特定社区或模块内的指标。通过最大化这个模块性,ModuleFind能够发现蛋白质网络中的强集团结构,从而更准确地识别出蛋白质超家族。
在实际应用中,ModuleFind在SCOP数据库上进行了验证。SCOP是一个广泛使用的蛋白质结构分类数据库,包含了不同级别的分类,如家族、结构域、折叠和超家族。实验结果显示,ModuleFind在超家族层面的聚类效果优于其他方法,其聚类结果与SCOP的分类基准更为接近,这表明该算法在揭示蛋白质之间的深层相似性和关联方面具有较高的效能。
关键词涉及蛋白质网络、序列相似性、远同源性、模块性、聚类和蛋白质结构分类数据库,这些都是该研究的核心概念。论文的贡献在于提供了一种新的工具,可以更好地理解和分析蛋白质的复杂关系,对于生物信息学和蛋白质功能预测等领域有重要的科学价值和实际应用潜力。
217 浏览量
144 浏览量
114 浏览量
132 浏览量
144 浏览量
106 浏览量
点击了解资源详情
184 浏览量
weixin_38643212
- 粉丝: 3
- 资源: 931
最新资源
- jquery开关按钮基于Bootstrap开关按钮特效
- merkle-react-client:客户
- 财务管理系统javaweb项目
- DOM-Parsing:DOM解析和序列化
- FastReport v6.7.11 Enterprise installer .zip
- pid控制器代码matlab-AutomatedBalancingRobot:自动平衡机器人是一个项目,其中建造了一个两轮机器人,并将其编程为
- 基于MATLAB模型设计的FPGA开发与实现.zip_UBK_matlab与fpga_simulink模型_struck9hw_
- ubiq:基于HugSQL和GraphQL的Web应用程序,移动部分最少
- 行业文档-设计装置-一种折叠式防滑书立.zip
- 意法半导体参考文献及软件资料.7z
- LoRa-High-Altitude-Balloon:这是蒙大拿州立大学LoRa小组顶峰项目的存储库,该项目是蒙大纳州太空资助财团BOREALIS实验室的项目。 以下代码在定制板上运行,该定制板上旨在收集高空气球有效载荷上的大气数据
- BW_Anal-开源
- nuaa_check_action:inuaa打卡,基于GitHub Action的南航校内,校外打卡
- alex_presso
- perf:PERF是详尽的重复查找器
- 行业文档-设计装置-一种折叠式包装纸箱.zip