pythonjieba库常用函数
时间: 2023-08-20 10:06:57 浏览: 104
jieba库的基本使用
5星 · 资源好评率100%
jieba库是一个中文分词库,常用的函数包括:
1. jieba.cut(sentence): 用于分词,返回一个可迭代的生成器,每次返回一个分词结果。
2. jieba.lcut(sentence): 返回一个列表,包含分词结果。
3. jieba.cut_for_search(sentence): 用于搜索引擎分词,返回一个可迭代的生成器,每次返回一个分词结果。
4. jieba.lcut_for_search(sentence): 返回一个列表,包含搜索引擎分词结果。
5. jieba.add_word(word, freq=None, tag=None): 向分词词典中添加新词。
6. jieba.del_word(word): 从分词词典中删除词语。
7. jieba.load_userdict(file_name): 加载用户自定义词典。
8. jieba.enable_parallel(num): 开启并行分词模式,num为并行进程数。
9. jieba.disable_parallel(): 关闭并行分词模式。
10. jieba.enable_paddle(): 开启Paddle模式,需要先安装PaddlePaddle。
11. jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=()): 关键词提取,返回一个列表,包含权重最大的topK个关键词。
12. jieba.analyse.textrank(sentence, topK=20, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v')): 基于TextRank算法的关键词提取,返回一个列表,包含权重最大的topK个关键词。
以上是常用的一些函数,还有其他的函数可以参考官方文档。
阅读全文