word2vec文本向量化代码
时间: 2023-10-21 11:18:29 浏览: 112
word2vec_词向量_
5星 · 资源好评率100%
以下是使用Python和gensim库实现Word2Vec模型的代码示例:
```python
from gensim.models import Word2Vec
# 读取文本数据
with open('text.txt') as f:
text = f.readlines()
# 将文本转换为单词列表
data = []
for sentence in text:
words = sentence.strip().split()
data.append(words)
# 训练Word2Vec模型
model = Word2Vec(data, size=100, window=5, min_count=5, workers=4)
# 获取单词向量
vector = model.wv['word']
# 保存模型
model.save('model.bin')
```
参数说明:
- data:文本数据,每个元素为一个单词列表。
- size:单词向量的维度。
- window:上下文窗口的大小,即考虑前后几个单词。
- min_count:忽略出现次数少于min_count的单词。
- workers:训练时使用的线程数。
使用Word2Vec模型得到单词向量后,可以将其用于文本分类、聚类等任务。
阅读全文