skipgram模型手写代码实现
时间: 2024-10-01 21:05:13 浏览: 37
Skip-gram模型是一种用于生成词嵌入的无监督学习算法,它通过预测上下文单词来学习单词的表示。下面是一个简单的Python手写skip-gram模型实现,使用gensim库:
```python
from gensim.models import Word2Vec
import numpy as np
# 假设我们有如下的文本数据,每个元素是一行的词汇列表
sentences = [['I', 'love', 'playing', 'tennis'],
['You', 'also', 'enjoy', 'swimming'],
['We', 'often', 'discuss', 'books']]
# 设置模型参数
min_count = 1 # 忽略频率低于这个值的单词
window_size = 5 # 上下文窗口大小
vector_size = 100 # 词向量维度
# 使用Word2Vec创建skip-gram模型
model = Word2Vec(sentences, min_count=min_count, window=window_size, size=vector_size)
# 访问和使用词向量
word = 'playing'
if word in model.wv:
print(f"Vector for '{word}':\n{model.wv[word]}")
# 获取该词的所有相似词
similar_words = model.wv.most_similar(word)
print(f"Similar words to '{word}': {similar_words}")
else:
print(f"'{word}' not found in the vocabulary.")
阅读全文