jieba库常用函数及描述
时间: 2023-10-10 20:13:33 浏览: 100
jieba库的基本使用
5星 · 资源好评率100%
1. jieba.cut(): 分词函数,将文本分成一个个词语并返回一个可迭代的generator对象。
2. jieba.lcut(): 返回一个列表,包含分词结果中的所有词语。
3. jieba.load_userdict(): 加载用户自定义词典。
4. jieba.add_word(): 向词典中添加新词。
5. jieba.del_word(): 删除词典中的词语。
6. jieba.suggest_freq(): 调整词语的词频,对于某些分词错误率高的词语可以通过调整词频来解决。
7. jieba.enable_parallel(): 开启并行分词模式,加速分词效率。
8. jieba.disable_parallel(): 关闭并行分词模式。
9. jieba.cut_for_search(): 适用于搜索引擎的分词函数,粒度比较细。
10. jieba.Tokenizer(dictionary=DEFAULT_DICT): 分词器对象,可以通过该对象自定义分词方式。
11. jieba.analyse.extract_tags(): 提取文本中的关键词,返回一个列表。
12. jieba.analyse.set_stop_words(): 设置停用词表,将不需要分析的词语加入到停用词表中。
13. jieba.analyse.TFIDF(): TF-IDF模型,用于关键词提取。
14. jieba.analyse.TextRank(): TextRank模型,用于关键词提取。
阅读全文