jieba库常用库函数及用法
时间: 2023-04-12 07:01:47 浏览: 197
jieba库是一个中文分词库,常用的库函数及用法如下:
1. jieba.cut(string, cut_all=False, HMM=True):对字符串进行分词,返回一个可迭代的生成器对象,每个元素为一个分词结果。
2. jieba.lcut(string, cut_all=False, HMM=True):对字符串进行分词,返回一个列表,每个元素为一个分词结果。
3. jieba.add_word(word, freq=None, tag=None):向分词词典中添加新词,freq为词频,tag为词性。
4. jieba.del_word(word):从分词词典中删除指定词语。
5. jieba.load_userdict(file_name):加载用户自定义词典,file_name为文件路径。
6. jieba.enable_parallel(num):开启并行分词模式,num为并行进程数。
7. jieba.disable_parallel():关闭并行分词模式。
8. jieba.Tokenizer(dictionary=None):自定义分词器,dictionary为自定义词典。
9. jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=()):基于TF-IDF算法的关键词提取,返回一个列表,每个元素为一个关键词。
10. jieba.analyse.textrank(sentence, topK=20, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v')):基于TextRank算法的关键词提取,返回一个列表,每个元素为一个关键词。
以上就是jieba库常用的库函数及用法。