形成《活着》词频条形图代码
时间: 2023-07-23 21:40:00 浏览: 96
要生成《活着》的词频条形图,可以按照以下步骤进行:
1. 首先,需要将《活着》的文本内容读入Python中。可以使用`open`函数打开文本文件,并使用`read`方法读取其中的内容。例如:
```python
with open('huozhe.txt', 'r', encoding='utf-8') as f:
text = f.read()
```
2. 接下来,需要对文本进行分词并统计词频。可以使用第三方库jieba进行中文分词,使用collections库中的Counter进行词频统计。需要注意的是,jieba只能处理字符串类型的文本,不能处理文件对象。因此,需要先将读取到的文本内容转换为字符串类型。代码如下:
```python
import jieba
from collections import Counter
words = jieba.lcut(text)
word_counts = Counter(words)
```
3. 最后,可以使用第三方库matplotlib生成词频条形图。代码如下:
```python
import matplotlib.pyplot as plt
# 设置字体,避免中文乱码
plt.rcParams['font.sans-serif']=['SimHei']
# 取出前20个出现频率最高的词及其词频
top_words = word_counts.most_common(20)
# 分别取出词和词频
words = [w[0] for w in top_words]
counts = [w[1] for w in top_words]
# 绘制条形图
plt.bar(words, counts)
# 设置标题和坐标轴标签
plt.title('《活着》词频统计')
plt.xlabel('词语')
plt.ylabel('词频')
# 自动调整X轴标签旋转角度
plt.xticks(rotation=90)
# 显示图形
plt.show()
```
运行上述代码,就可以生成《活着》的词频条形图了。需要注意的是,代码中的`huozhe.txt`是《活着》文本文件的路径,需要根据实际情况进行修改。
阅读全文