jieba库中的所有函数
时间: 2023-06-12 12:06:52 浏览: 1309
jieba库中的所有函数如下:
1. jieba.cut: 分词函数,接收一个字符串参数,返回一个可迭代的生成器,每个元素为分好的词语。
2. jieba.cut_for_search: 搜索引擎模式下的分词函数,接收一个字符串参数,返回一个可迭代的生成器,每个元素为分好的词语。
3. jieba.lcut: 精确模式下的分词函数,接收一个字符串参数,返回一个列表,每个元素为分好的词语。
4. jieba.lcut_for_search: 搜索引擎模式下的分词函数,接收一个字符串参数,返回一个列表,每个元素为分好的词语。
5. jieba.cut_crf: CRF模型分词,接收一个字符串参数,返回一个可迭代的生成器,每个元素为分好的词语。
6. jieba.tokenize: 返回词语在原文中的起止位置及词语本身,接收一个字符串参数,返回一个可迭代的生成器,每个元素为元组,包括词语、起始位置、结束位置。
7. jieba.add_word: 添加词语到分词词典中,接收一个字符串参数。
8. jieba.del_word: 从分词词典中删除指定词语,接收一个字符串参数。
9. jieba.load_userdict: 加载用户自定义词典,接收一个文件路径参数。
10. jieba.suggest_freq: 调整指定词语的词频,接收一个元组参数,包括词语和词频。
11. jieba.enable_parallel: 开启并行分词模式,接收一个整数参数,指定并行分词进程数。
12. jieba.disable_parallel: 关闭并行分词模式。
13. jieba.enable_paddle: 开启飞桨深度学习框架分词模式。
14. jieba.disable_paddle: 关闭飞桨深度学习框架分词模式。
15. jieba.enable_windowing: 开启窗口分词模式,接收一个整数参数,指定窗口大小。
16. jieba.disable_windowing: 关闭窗口分词模式。
17. jieba.get_FREQ: 获取指定词语在分词词典中的词频,接收一个字符串参数。
18. jieba.get_DAG: 获取分词DAG图,接收一个字符串参数。
19. jieba.get_POS: 获取指定词语的词性,接收一个字符串参数。
20. jieba.Tokenizer: 分词器类,可以自定义词典和分词模式等参数。
阅读全文