《活着》高频词的条形图代码
时间: 2023-09-20 12:03:06 浏览: 154
以下是使用Python的matplotlib库生成《活着》高频词的条形图代码示例:
```python
import matplotlib.pyplot as plt
from collections import Counter
# 读取文本文件
with open('活着.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分割单词
words = text.split()
# 统计词频
word_counts = Counter(words)
# 获取前20个高频词及其词频
top_words = word_counts.most_common(20)
top_words = dict(top_words)
# 绘制条形图
plt.bar(top_words.keys(), top_words.values(), width=0.5)
plt.title('《活着》高频词')
plt.xlabel('单词')
plt.ylabel('词频')
plt.xticks(rotation=90)
plt.show()
```
需要注意的是,需要先将《活着》的文本文件放到代码所在的文件夹中,并且需要安装matplotlib库。
相关问题
《活着》高频词条形图代码
以下是《活着》高频词条形图的 Python 代码:
```python
import jieba
from collections import Counter
import matplotlib.pyplot as plt
# 读取《活着》文本
with open('huzi.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用结巴分词进行分词
words = jieba.cut(text)
# 统计词频
word_counts = Counter(words)
top_words = word_counts.most_common(20)
# 绘制形图
labels = [x[0] for x in top_words]
counts = [x[1] for x in top_words]
plt.bar(labels, counts)
plt.title('《活着》高频词汇')
plt.xlabel('词汇')
plt.ylabel('出现次数')
plt.show()
```
其中,需要将文本文件 `huzi.txt` 与代码文件放在同一目录下,并且需要安装 `jieba` 和 `matplotlib` 库。执行代码后,即可得到《活着》高频词汇的形图。
《活着》高频词的条形图代码运行
以下是使用Python中的matplotlib库绘制《活着》高频词条形图的代码:
```python
import matplotlib.pyplot as plt
import pandas as pd
# 读取数据
data = pd.read_csv('huzi_wordcount.csv', encoding='utf-8')
# 按照词频降序排列
data = data.sort_values('count', ascending=False)
# 取前20个高频词绘制条形图
top20 = data[:20]
plt.bar(top20['word'], top20['count'])
plt.title('《活着》高频词条形图')
plt.xlabel('词语')
plt.ylabel('词频')
plt.xticks(rotation=90) # 横坐标标签旋转90度
plt.show()
```
其中,需要将《活着》文本进行分词,并统计每个词语出现的次数,最终保存为一个csv文件(例:huzi_wordcount.csv)。在代码中,我们通过pandas库读取该文件,并对数据进行处理,最后利用matplotlib库绘制条形图。
阅读全文