python中词向量矩阵如何用代码表示
时间: 2024-05-04 18:16:46 浏览: 73
基于词向量的机器翻译Python代码
在 Python 中,可以使用第三方库如 gensim 或者 spaCy 来加载预训练的词向量模型,例如 Word2Vec 或者 GloVe 模型。这些预训练的词向量模型通常会提供一个词汇表和对应的词向量矩阵。
下面是一个使用 gensim 加载 Word2Vec 模型,并获取词向量矩阵的示例代码:
```python
import gensim
model_path = "path/to/word2vec/model"
w2v_model = gensim.models.Word2Vec.load(model_path)
# 获取词汇表
vocab = w2v_model.wv.vocab
# 获取词向量矩阵
embedding_matrix = w2v_model.wv.vectors
```
在上面的代码中,`model_path` 变量指定了 Word2Vec 模型的路径,`w2v_model` 变量加载了模型。通过 `w2v_model.wv.vocab` 可以获取词汇表,通过 `w2v_model.wv.vectors` 可以获取词向量矩阵。注意,词向量矩阵的行数即为词汇表的大小,列数为每个词向量的维度。
阅读全文