jieba分词后,统计特定词语的词频代码怎么写?
时间: 2024-05-12 16:16:30 浏览: 70
使用python的jieba库实现词频统计.zip
假设要统计的特定词语为“中国”,代码如下:
```python
import jieba
from collections import Counter
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分词
words = jieba.cut(text)
# 统计词频
word_freq = Counter(words)
# 输出特定词语的词频
print(word_freq['中国'])
```
其中,`jieba.cut()`函数用于对文本进行分词,返回的是一个生成器对象。`Counter()`函数用于统计词频,返回的是一个字典对象,其中键为词语,值为词频。最后,可通过字典的键来获取特定词语的词频。
阅读全文