已有向量词典,计算一个句子的向量,写代码
时间: 2023-05-12 19:03:10 浏览: 62
可以使用Python中的gensim库来计算句子的向量。首先需要加载预训练好的词向量模型,然后将句子中的每个词转换为对应的向量,最后将所有词向量取平均即可得到句子的向量表示。
以下是示例代码:
```python
from gensim.models import KeyedVectors
# 加载预训练好的词向量模型
model = KeyedVectors.load_word2vec_format('path/to/word2vec.bin', binary=True)
# 计算句子的向量
def sentence_vector(sentence):
words = sentence.split()
vectors = []
for word in words:
try:
vectors.append(model[word])
except KeyError:
# 如果词不在词向量模型中,则忽略该词
pass
if len(vectors) == 0:
# 如果句子中所有词都不在词向量模型中,则返回None
return None
else:
return sum(vectors) / len(vectors)
# 示例
sentence = '这是一个示例句子'
vector = sentence_vector(sentence)
print(vector)
```
注意:需要提前下载预训练好的词向量模型,并将其保存为二进制格式。可以从以下链接下载中文词向量模型:
https://github.com/Embedding/Chinese-Word-Vectors