KeyedVectors.load_word2vec_format
时间: 2024-01-18 17:05:10 浏览: 294
word2vector
`KeyedVectors.load_word2vec_format` 是 Gensim 库中的一个函数,用于加载预训练的 Word2Vec 模型。它可以将预先训练好的 Word2Vec 模型加载到内存中,并返回一个 `KeyedVectors` 对象,该对象提供了一些方便的方法来操作和查询词向量。
这个函数的参数包括:
- `fname`: 预训练的 Word2Vec 模型文件路径
- `binary`: 是否使用二进制格式加载模型(默认为 `True`)
- `limit`: 限制加载的词向量数量(默认为 `None`,即加载所有的词向量)
- `datatype`: 指定词向量的数据类型(默认为 `numpy.float32`)
示例代码:
```python
from gensim.models import KeyedVectors
# 加载预训练的 Word2Vec 模型
model_path = 'path/to/pretrained/word2vec/model'
word_vectors = KeyedVectors.load_word2vec_format(model_path, binary=True, limit=50000)
# 查询单词的向量
vector = word_vectors['apple']
# 计算两个单词的余弦相似度
similarity = word_vectors.similarity('apple', 'orange')
```
阅读全文