You must specify either total_examples or total_words, for proper learning-rate and progress calculations. If you've just built the vocabulary using the same corpus, using the count cached in the model is sufficient: total_examples=model.corpus_count.
时间: 2024-03-06 08:52:08 浏览: 80
CountV1-4(count).zip_CAD 统计_CountV1-4._CountV1-4.lsp_count.lsp_s
这个警告信息通常在训练 Word2Vec 模型时出现。它的意思是你必须指定 total_examples 或 total_words,以便模型可以计算正确的学习率和进度。
如果你已经在训练模型之前使用相同的语料库创建了词汇表,那么可以使用 `model.corpus_count` 缓存中的计数,将其作为 total_examples 参数传递给训练方法。
示例代码:
```python
model.build_vocab(sentences)
model.train(sentences, total_examples=model.corpus_count, epochs=model.epochs)
```
如果你不想使用缓存中的计数,也可以将 total_examples 或 total_words 参数设置为语料库中的实际值。总的来说,这个警告信息并不会导致代码出错,但是如果你想获得更好的训练效果,最好按照提示设置相应的参数。
阅读全文