XGBScore: 基于XGBoost的结构虚拟筛选蛋白质配体评分系统

需积分: 16 163 浏览量更新于2024-12-19 收藏 14.36MB ZIP 举报

以下是该资源所涵盖的主要知识点： 1. XGBoost算法原理：XGBoost（eXtreme Gradient Boosting）是一种高效的机器学习算法，它基于决策树算法，通过梯度提升（Gradient Boosting）技术迭代优化，以提升模型的预测性能。在本项目中，XGBoost被用来对蛋白质-配体相互作用的亲和力进行二进制分类。 2. 蛋白质-配体结合评分：在药物发现和生物化学研究中，了解蛋白质与其配体（通常是药物分子或其他生物活性分子）的结合能力是非常重要的。通过评分机制可以对这种亲和力进行量化，从而筛选出潜在的活性分子。 3. 基于结构的虚拟筛选：这是一种药物设计技术，通过分析蛋白质与配体的结构信息，模拟它们之间的相互作用，从而识别出可能具有生物学活性的分子。这种方法可以显著缩小潜在药物分子的搜索范围。 4. Python在生物信息学中的应用：本项目使用Python作为编程语言，主要利用其在数据处理、机器学习和生物信息学领域的丰富库资源，如XGBoost、scikit-learn等。 5. 数据库应用：项目中使用的训练数据来源于多个生物信息学数据库，包括： - 绑定MOAD：一个收录了已知药物分子与其蛋白质靶标相互作用数据的数据库。 - 聚溴乙烯：该数据库具体指向不明，但根据描述可能涉及与生物分子相互作用的数据集。 - 铱：可能是指某个特定的生物信息学数据库，包含相关的结构和化学信息。 - 生成的诱饵数据：指在实验中使用假阳性或假阴性数据进行模型训练，以提高模型的泛化能力。 6. Python库：scikit-learn是Python中用于数据挖掘和数据分析的模块，提供了许多用于机器学习的工具，包括分类、回归、聚类等算法。XGBoost算法的实现和集成在Python中是通过XGBoost库来完成的。 7. 虚拟筛选的应用与挑战：在药物发现过程中，虚拟筛选技术被广泛应用以减少实验成本和提高筛选效率。然而，它也面临挑战，如如何准确建模分子间的相互作用，如何处理大规模数据集以及如何提高筛选的准确性和速度。通过了解以上知识点，可以对该XGBScore项目的背景、目的、实现方法和应用领域有更深入的认识。此外，该项目的发布也为生物信息学和机器学习领域的研究者提供了一个实际应用XGBoost算法进行蛋白质-配体结合评分的案例。"

资源目录

收起资源包目录

XGBScore: 基于XGBoost的结构虚拟筛选蛋白质配体评分系统（46个子文件）

2vc7_output.png 45KB

Labbook.ipynb 2.61MB

druglike_screener-checkpoint.py 4KB

LIT_PCBA_overlap_breakdown.png 69KB

Labbook-checkpoint.ipynb 280KB

1ajp_ligand.png 46KB

smile_generator.py 5KB

LIT_PCBA_overlap.png 12KB

1a28_receptor.png 82KB

2vc7_ligands.png 13KB

1b7h_full.png 168KB

data_cleaning.png 261KB

.gitignore 42B

Data_Cleaning.drawio 5KB

MOAD_pocket_and_ligand_isolator.py 13KB

PDB_pocket_isolator.py 9KB

rapid_docker.py 7KB

1a0t_full.png 190KB

5l2o_ligand.png 54KB

docking.gif 8.46MB

1ui0_ligand_only.png 9KB

README.md 737B

1a28_pocket.png 62KB

5x13_ligand.png 47KB

.gitattributes 34B

1a0t_ligands.png 49KB

LIT_PCBA_overlap_breakdown-checkpoint.png 1KB

Labbook-checkpoint.ipynb 2.61MB

README-checkpoint.md 633B

1b7h_ligand.png 14KB

decoy_generation.png 164KB

Iridium_pocket_isolator.py 8KB

data_cleaning-checkpoint.png 75KB

5x13_full.png 91KB

multithread_pdbqt_batch_converter.py 5KB

2vc7_full.png 382KB

Feature Engineering.drawio 2KB

Data_Cleaning-checkpoint.drawio 2KB

druglike_screener.py 3KB

make_pdb_copies.py 1KB

pdbqt_batch_converter.py 5KB

1ui0_full.png 114KB

1a28_pdbbind.png 131KB

parse_binana_output.py 2KB

data_cleaning_pipeline-checkpoint.png 70KB

Decoy_Generation.drawio 3KB

共 46 条

PeterLee龍羿學長

粉丝: 40

XGBScore: 基于XGBoost的结构虚拟筛选蛋白质配体评分系统

XGBFEMF：基本蛋白质预测的基于XGBoost的框架

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

diminico_02_0709.pdf

agenda_3cd_01_0716.pdf

A课件Python全栈开发线下班.zip

diminico_02_1108.pdf

基于人工智能大模型技术的果蔬农技知识智能问答系统.pdf

最新资源