python实现中文词频统计
时间: 2023-07-31 08:10:21 浏览: 102
要实现中文词频统计,可以使用Python中的jieba库和collections库。
首先需要安装jieba库,可以使用以下命令进行安装:
```
pip install jieba
```
接下来,我们可以编写以下代码来进行中文文本词频统计:
```python
import jieba
from collections import Counter
# 读取文本文件
with open("text.txt", "r", encoding="utf-8") as f:
text = f.read()
# 分词
words = jieba.cut(text)
# 统计词频
word_counts = Counter(words)
# 输出前10个高频词
for word, count in word_counts.most_common(10):
print(word, count)
```
其中,text.txt是需要统计词频的文本文件,可以根据实际情况进行修改。执行以上代码后,即可输出前10个高频词及其出现次数。
阅读全文