from gensim.models import word2vec model = word2vec.Word2Vec.load('C:\\Users\\86157\\Desktop\\Course\\AI\\model_300dim.pkl') from mol2vec.features import mol2alt_sentence,mol2sentence, MolSentence ,DfVec, sentences2vec data['sentence'] = data.apply(lambda x:MolSentence(mol2alt_sentence(x['mol'],1)),axis =1) data['mol2vec'] = [DfVec(x) for x in sentences2vec(data['sentence'], model, unseen='UNK')] X_mol = np.array([x.vec for x in data['mol2vec']]) X_mol = pd.DataFrame(X_mol) X_mol.columns = X_mol.columns.astype(str) new_data = pd.concat((X,X_mol),axis = 1) x_train,x_test,y_train,y_test = train_test_split(new_data,y ,test_size=.20 ,random_state = 1) x_train = StandardScaler().fit_transform(x_train) x_test = StandardScaler().fit_transform(x_test) lr = LogisticRegression(max_iter=10000) lr.fit(x_train,y_train) evaluation_class(lr,x_test,y_test) rf=RandomForestClassifier(max_depth=4,random_state=0) rf.fit(x_train,y_train) evaluation_class(rf,x_test,y_test) sm = svm.SVC(gamma='scale',C=1.0,decision_function_shape='ovr',kernel='rbf',probability=True) sm.fit(x_train,y_train) evaluation_class(sm,x_test,y_test)
时间: 2023-12-24 17:21:24 浏览: 148
这段代码是在使用mol2vec方法提取药物分子的特征,并将提取的特征与之前使用的化学描述符特征进行合并,然后使用LogisticRegression、RandomForestClassifier和SVM三种模型进行药物筛选预测。其中,使用了word2vec模型对分子进行编码,得到分子的mol2vec特征,将其与之前提取的化学描述符特征进行合并,并使用ROC曲线和AUC值进行模型性能评估。请问你还有什么问题需要我解答吗?
相关问题
import gensim.models.keyedvectors as word2vec 与from gensim.models import Word2Vec有什么区别
这两个语句导入的是不同的模块。
`import gensim.models.keyedvectors as word2vec` 导入的是 `gensim` 库中的 `keyedvectors` 模块,该模块提供了一些操作词向量的方法。这个模块中的 `KeyedVectors` 类可以用来加载预训练的词向量模型文件并进行相关操作。
而 `from gensim.models import Word2Vec` 导入的是 `gensim` 库中的 `Word2Vec` 模块,该模块提供了训练和使用词向量的相关方法。这个模块中的 `Word2Vec` 类可以用来训练词向量模型。
总之,两个模块都是与词向量相关的,但是提供的功能不同。`keyedvectors` 模块提供了一些在预训练的词向量上进行操作的方法,而 `Word2Vec` 模块提供了训练和使用词向量的方法。
from gensim.models import word2vec
这是一个Python库中的模块,用于训练和使用Word2Vec模型。Word2Vec是一种用于将单词表示为向量的技术,它可以用于自然语言处理任务,如文本分类、情感分析和语义相似性计算等。该模块提供了一些函数和类,可以用于训练Word2Vec模型、加载预训练的模型以及使用模型进行单词相似性计算等操作。
阅读全文