利用Python对/连接的中文字符分词,并统计分词后的频数,并将该频数绘制出直方图
时间: 2024-03-25 21:36:53 浏览: 69
基于Python进行汉字字频统计【100012178】
针对您的问题,可以使用Python中的matplotlib库绘制直方图。具体实现如下:
```python
import jieba
from collections import Counter
import matplotlib.pyplot as plt
text = "这是一段中文文本,用于测试中文分词和频数统计的功能。"
# 对文本进行分词
seg_list = jieba.cut(text)
# 统计分词后的频数
word_counts = Counter(seg_list)
# 绘制直方图
plt.bar(word_counts.keys(), word_counts.values())
plt.xticks(rotation=90)
plt.show()
```
运行上述代码,会弹出一个窗口显示绘制的直方图。
注意,需要先安装matplotlib库,可以使用以下命令进行安装:
```
pip install matplotlib
```
另外,由于中文字符在直方图中可能会出现乱码问题,可以在绘制直方图前添加以下代码解决:
```python
import matplotlib
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['axes.unicode_minus'] = False
```
这段代码会将字体设置为中文SimHei,并解决负号乱码问题。
阅读全文