gensim.models.word2vec.wv参数说明
时间: 2023-06-07 10:07:27 浏览: 159
深度学习gensim训练词向量word2vec
gensim.models.word2vec.wv有以下常用的参数说明:
- vector_size:词向量维度。
- window:窗口大小,表示当前词与预测词在一个句子中的最大距离。
- min_count:忽略出现次数低于该值的单词。
- workers:训练的并发数。
- sg:训练算法,当 sg=0 时,采用 CBOW 模型,当 sg=1 时,采用 Skip-Gram 模型。
- negative:负采样大小,通常在 [5, 20] 之间。
- sample:高频词采样的阈值,范围为 [0, 1e-5]。
- alpha:学习率,通常在 [0.025, 0.001] 之间。
- min_alpha:学习率的最小值。
- epochs:迭代次数。
以上参数是常用的,具体应根据实际情况进行调整。
阅读全文