python实现word2vec
时间: 2023-10-21 20:10:47 浏览: 98
在Python中实现Word2Vec,可以使用gensim库。以下是一个简单示例:
```python
from gensim.models import Word2Vec
# 定义语料库
sentences = [['this', 'is', 'the', 'first', 'sentence', 'for', 'word2vec'],
['this', 'is', 'the', 'second', 'sentence'],
['yet', 'another', 'sentence'],
['one', 'more', 'sentence'],
['and', 'the', 'final', 'sentence']]
# 训练模型
model = Word2Vec(sentences, min_count=1)
# 打印和单词“sentence”最相似的单词
print(model.wv.most_similar('sentence'))
```
在这个示例中,我们定义了一个包含5个句子的语料库,并使用Word2Vec模型进行训练。然后,我们打印与单词“sentence”最相似的单词。
注意,我们使用了`min_count`参数,其默认值为5。这意味着只有在语料库中出现至少5次的单词才会被考虑。您可以根据您的需要调整此参数。
此外,Word2Vec模型还具有许多其他参数,例如`size`(单词向量的大小)和`window`(定义上下文窗口的大小)。您可以通过查看gensim文档来了解更多信息。
阅读全文