jieba提取高频词
时间: 2024-03-23 09:33:17 浏览: 162
Lowpoly风街霸角色布兰卡(Blanka)Blender源文件
jieba是一个常用的中文分词工具,可以用于提取文本中的高频词。下面是使用jieba提取高频词的示例代码:
```python
import jieba
from collections import Counter
# 待分词的文本
text = "这是一个测试文本,用于演示jieba提取高频词的功能。"
# 使用jieba进行分词
words = jieba.cut(text)
# 统计词频
word_counts = Counter(words)
# 获取高频词
top_words = word_counts.most_common(5) # 提取前5个高频词
# 输出结果
for word, count in top_words:
print(word, count)
```
运行以上代码,将会输出文本中的前5个高频词及其出现次数。你也可以根据需要修改代码中的参数来提取不同数量的高频词。
阅读全文