请用python完成,调用word2vec计算两个中文短句的相似度
时间: 2023-12-08 14:05:19 浏览: 86
word2vec词向量训练及中文文本相似度计算
好的,需要安装gensim库来调用word2vec。以下是一个示例代码:
```python
from gensim.models import Word2Vec
import jieba
# 加载预训练好的中文word2vec模型
model = Word2Vec.load('path/to/pretrained/word2vec/model')
# 定义两个中文短句
sentence1 = '我喜欢吃水果'
sentence2 = '水果是我的最爱'
# 对两个短句进行分词
words1 = jieba.cut(sentence1)
words2 = jieba.cut(sentence2)
# 计算两个短句的相似度
similarity = model.wv.n_similarity(words1, words2)
print('两个短句的相似度为:', similarity)
```
在代码中,我们首先加载了预训练好的中文word2vec模型,然后对两个中文短句进行了分词,并使用`n_similarity`方法计算它们的相似度。最后输出了相似度的结果。需要注意的是,由于gensim库默认使用的是utf-8编码,因此输入的中文短句也需要是utf-8编码的。
阅读全文