如何在from jieba import analyse 批量增加非停用词词表
时间: 2023-06-12 20:01:59 浏览: 111
jieba停用词分词表
您可以通过以下步骤实现在from jieba import analyse中批量增加非停用词词表:
1. 创建一个新的文本文件,包含您想要添加到词表的所有非停用词。
2. 使用Python的open()函数打开这个文件,以只读模式读取其中的内容,例如:
with open('nonstop_words.txt', 'r', encoding='utf-8') as f:
words = f.readlines()
3. 对于从jieba.analyse导入的textrank模块,可以使用下面的代码批量增加非停用词:
from jieba import analyse
analyse.set_stop_words("stop_words.txt")
# 添加非停用词
for word in words:
analyse.add_word(word.strip())
在这里,“stop_words.txt”是包含停用词的文件,通过调用set_stop_words()函数指定词表后,使用add_word()函数将非停用词逐个添加到textrank的词表中。
通过以上步骤,您就可以将非停用词批量添加到jieba.analyse中了。
阅读全文