MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction的预训练任务有哪些

MG-BERT是一种基于BERT的预训练模型，用于分子性质预测。它的预训练任务主要包括： 1. 原子掩模预测（Atomic Masked Language Model，AMLM）：在输入的分子中，随机选取一些原子进行掩模，然后训练模型预测这些掩模原子的标识符。 2. 原子邻接预测（Atomic Adjacency Prediction，AAP）：对于输入的分子中的每个原子，模型预测其所有邻接原子的标识符。 3. 拆分分子预测（Molecule Splitting Prediction，MSP）：将输入的分子随机拆分为两个子分子，然后训练模型预测这两个子分子的标识符。 4. 分子掩模预测（Molecule Masked Language Model，MMLM）：在输入的分子中，随机选取一些分子片段进行掩模，然后训练模型预测这些掩模分子片段的标识符。这些预训练任务旨在让模型学习分子结构和特征，以提高其性能在分子性质预测任务中的表现。

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction预训练策略

MG-BERT是一种用于分子属性预测的预训练模型，它是基于BERT的模型。它的预训练策略可以分为以下几步： 1. 原子嵌入：使用晶体学数据库（CSD）中的晶体结构数据，从中提取原子坐标并将其转换为原子嵌入表示。 2. 无监督原子表示学习：使用Transformer编码器，对原子嵌入进行无监督的原子表示学习。通过掩码语言建模任务（MLM）和下一句预测任务（NSP）来训练模型。 3. 有监督分子属性预测：使用已知的分子属性数据集，对MG-BERT进行有监督的微调。在预训练阶段，MG-BERT使用了与BERT类似的预训练任务，例如掩码语言建模任务和下一句预测任务。这些任务的目的是让模型学习原子之间的关系和上下文信息。在微调阶段，MG-BERT使用已知的分子属性数据集进行有监督的微调，以预测分子的性质。

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction详细介绍3000字

MG-BERT是一种基于BERT模型的分子属性预测方法。在药物研发领域中，准确预测分子的物化性质对于药物发现至关重要。传统的方法需要大量的实验数据和计算资源，而且对于复杂的分子结构预测效果有限。因此，利用机器学习技术来预测分子的物化性质成为了一种新的解决方案。 MG-BERT使用了无监督学习方法来学习原子的表示，这是其与传统方法的区别之一。在无监督学习中，不需要手动标注数据集来指导模型的训练，而是让模型自己学习数据中的特征。MG-BERT使用的BERT模型是一种预训练语言模型，它在大规模的文本数据上进行训练，学习出了一个通用的语言表示，可以用于各种自然语言处理任务。MG-BERT将BERT模型应用于分子结构，将分子中的原子序列作为输入，让模型学习原子的表示。为了训练MG-BERT模型，需要大量的分子数据。MG-BERT使用了公开的分子数据库，包括ChEMBL、PDB等，这些数据集包含了大量的分子结构信息。为了将分子结构转化为可以输入到BERT模型的格式，MG-BERT使用了SMILES表示法。SMILES是化学分子的一种文本表示方法，可以将分子结构表示为一个字符串。MG-BERT将SMILES表示的分子结构作为输入，利用BERT模型学习原子的表示。 MG-BERT使用了两种方法来预测分子的物化性质。首先，利用BERT模型学习到的原子表示来计算分子的表示。这个分子表示可以用于各种分子属性预测任务，如溶解度、毒性等。其次，MG-BERT还使用了一种基于图神经网络的方法来预测分子的属性。这种方法将分子结构表示为一个图，并利用图神经网络学习分子的表示。这个方法可以捕捉分子结构的全局特征，对于预测复杂的分子属性效果更好。为了评估MG-BERT的预测效果，研究人员对多个分子属性进行了预测，如溶解度、毒性、生物活性等。实验结果表明，MG-BERT相比于其他分子属性预测方法具有更高的准确率和更好的性能。这表明，MG-BERT可以成为一种新的高效、精确的分子属性预测方法，有望在药物研发领域中得到广泛应用。

阅读全文

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction的预训练任务有哪些

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction预训练策略

MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction详细介绍3000字

相关推荐

预训练模型BERT介绍

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks下载

ToD-BERT:ToD-BERT的预训练模型

LIMIT-BERT：在《 EMNLP 2020调查结果》中发布的“ LIMIT-BERT：语言学告知的多任务BERT”的源代码

KR-BERT：基于KoRean的BERT预训练模型（KR-BERT），用于Tensorflow和PyTorch

Graph-Bert:“ Graph-Bert”的源代码-Source code learning

mongolian-bert:预训练的蒙古BERT模型

covid-twitter-bert：用于分析COVID-19 Twitter数据的预训练BERT模型

Graph-Bert:Graph-Bert的源代码

Kaleido-BERT:（CVPR2021）Kaleido-BERT

ner-bert：带有Google bert的BERT-NER（nert-bert）https：//github.comgoogle-research

K-BERT：K-BERT（AAAI2020）的源代码

keras-bert:BERT的实现可以加载官方的预训练模型以进行特征提取和预测

Lyrics-Generation-using-BERT：使用BERT生成English Rock歌词

NAG-BERT:该存储库包含NAG-BERT论文的代码，数据和模型

Getting-Started-with-Google-BERT:使用BERT构建和训练最先进的自然语言处理模型

Fast-Bert: 简化BERT和XLNet文本分类模型训练

基于SpringBoot的“古城景区管理系统”的设计与实现（源码+数据库+文档+PPT).zip

大家在看

C语言课程设计《校园新闻发布管理系统》.zip

基于ArcPy实现的熵权法赋值地理处理工具

B-6 用户手册.doc

非线性规划讲义-方述诚

基于Nios II的电子时钟设计

最新推荐

自然语言处理-基于预训练模型的方法-笔记

BERT预训练模型字向量提取工具–使用BERT编码句子

Keras 实现加载预训练模型并冻结网络的层

浅谈keras使用预训练模型vgg16分类,损失和准确度不变

BERT实现情感分析.

Vim/gVim中高效编辑Matlab脚本的技巧与工具介绍

24小时精通TestNG框架：新手入门的完整指南

CH340驱动预安装

WinCE 6.0 SDK与仿真器的安装指南

数据库概念深度解析：关系模型与ER模型的内在联系及应用