运用word2vec计算两个词的相似度
时间: 2023-12-08 07:05:54 浏览: 83
中文文本预处理,Word2Vec训练计算文本相似度.zip
5星 · 资源好评率100%
可以使用余弦相似度来计算两个词在word2vec中的相似度。具体步骤如下:
1. 导入gensim库
```python
import gensim
```
2. 加载预训练好的word2vec模型
```python
model = gensim.models.KeyedVectors.load_word2vec_format('path/to/pretrained/word2vec/model', binary=True)
```
其中,'path/to/pretrained/word2vec/model'指的是预训练好的word2vec模型文件的路径,需要根据实际情况进行修改。
3. 计算两个词的相似度
```python
similarity = model.similarity('word1', 'word2')
```
其中,'word1'和'word2'是两个需要计算相似度的词。
完整代码如下:
```python
import gensim
model = gensim.models.KeyedVectors.load_word2vec_format('path/to/pretrained/word2vec/model', binary=True)
similarity = model.similarity('word1', 'word2')
print(similarity)
```
需要注意的是,如果两个词不在训练集中,那么会抛出KeyError异常。因此,在计算相似度之前,需要确保两个词都在训练集中。
阅读全文