jieba库怎么统计词语出现的数量
时间: 2024-12-24 07:01:32 浏览: 3
jieba库是一个用于中文分词的Python库,它并不直接提供词语计数的功能。不过你可以通过结合jieba的分词功能和Python内置的collections模dule来统计词语出现的数量。以下是一个简单的示例:
```python
import jieba
from collections import Counter
def count_words(text):
# 使用jieba进行分词
words = jieba.lcut(text)
# 将分词结果转换为小写并去除无用字符(如标点符号)
words = [word.lower() for word in words if word.isalnum()]
# 使用Counter计算每个单词的频率
word_counts = Counter(words)
return word_counts
# 示例文本
text = "这是一个用于演示jieba分词并统计词频的例子。"
word_frequency = count_words(text)
# 输出词语及其频率
for word, freq in word_frequency.items():
print(f"{word}: {freq}")
阅读全文