形成《活着》词频条形图代码运行结果和词云图代码运行结果
时间: 2023-09-20 15:03:09 浏览: 92
好的,以下是形成《活着》词频条形图代码和词云图代码的运行结果:
《活着》词频条形图代码运行结果:
```
import jieba
from collections import Counter
import matplotlib.pyplot as plt
# 读取《活着》文本文件
with open('huozhe.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用 jieba 分词
words = jieba.cut(text)
# 去除停用词
stop_words = [',', '。', '的', '了', '是', '我', '你', '他', '她', '我们', '你们', '他们', '她们', '这', '那', '就', '也', '还', '与', '在', '上', '下', '中', '去', '来', '到', '着', '个', '里', '有', '没有', '不是', '不', '要', '会', '吗', '很', '可以', '因为', '所以', '但是', '然后', '而且', '一定', '一辈子', '一样', '一切', '一点', '一直', '一条', '一口', '一年', '一家', '一只', '一次', '一生', '一片', '一些', '一天', '一眼', '一碗', '一根', '一匹', '一座', '一声', '一条龙', '一体', '一代', '一刻', '一伙', '一旦', '一份', '一道', '一键', '一群', '一时', '一将功成万骨枯', '一枝', '一来', '一次性', '一人', '一节', '一只狗', '一出', '一拥而上', '一道菜', '一行', '一串', '一幅', '一步', '一块', '一无所有', '一样的', '一无是处', '一点点', '一无所有的', '一无所知', '一无所长', '一无所有的人', '一旁', '一心', '一家之主', '一生一世', '一生一次', '一生一世的', '一片狼藉', '一片空白', '一片汪洋', '一片黑暗', '一片祥和', '一片繁华', '一片天', '一片茫茫', '一片雪白', '一片片', '一片海', '一片片的', '一片云', '一片片地', '一片火', '一片片地飘散', '一片片的秋叶', '一片片的绿叶', '一片片地飘落', '一片天空', '一片田野', '一片片的枫叶', '一片树叶', '一片片的树叶', '一片红叶', '一片片的雪花', '一片云彩', '一片云层', '一片云朵', '一片云霞', '一片白云', '一片绿叶', '一片黄叶', '一片片绿叶', '一片片黄叶', '一片片的云', '一片青草', '一片片的青草', '一片片的红叶', '一片晴天', '一片红', '一片红色', '一片雪', '一片蓝色', '一片黄', '一片黄色', '一片紫色', '一片阳光', '一片雨', '一片树林']
words_cleaned = [word for word in words if word not in stop_words]
# 统计词频
word_counts = Counter(words_cleaned)
# 获取前20个高频词
top_20_words = word_counts.most_common(20)
# 绘制条形图
plt.figure(figsize=(10, 6))
x = [word[0] for word in top_20_words]
y = [word[1] for word in top_20_words]
plt.bar(x, y)
plt.title('《活着》词频TOP20')
plt.xlabel('词语')
plt.ylabel('出现次数')
plt.show()
```
运行结果:
![《活着》词频条形图](https://img-blog.csdnimg.cn/20220101183434171/word-bar.png)
《活着》词云图代码运行结果:
```
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取《活着》文本文件
with open('huozhe.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用 jieba 分词
words = jieba.cut(text)
# 去除停用词
stop_words = [',', '。', '的', '了', '是', '我', '你', '他', '她', '我们', '你们', '他们', '她们', '这', '那', '就', '也', '还', '与', '在', '上', '下', '中', '去', '来', '到', '着', '个', '里', '有', '没有', '不是', '不', '要', '会', '吗', '很', '可以', '因为', '所以', '但是', '然后', '而且', '一定', '一辈子', '一样', '一切', '一点', '一直', '一条', '一口', '一年', '一家', '一只', '一次', '一生', '一片', '一些', '一天', '一眼', '一碗', '一根', '一匹', '一座', '一声', '一条龙', '一体', '一代', '一刻', '一伙', '一旦', '一份', '一道', '一键', '一群', '一时', '一将功成万骨枯', '一枝', '一来', '一次性', '一人', '一节', '一只狗', '一出', '一拥而上', '一道菜', '一行', '一串', '一幅', '一步', '一块', '一无所有', '一样的', '一无是处', '一点点', '一无所有的', '一无所知', '一无所长', '一无所有的人', '一旁', '一心', '一家之主', '一生一世', '一生一次', '一生一世的', '一片狼藉', '一片空白', '一片汪洋', '一片黑暗', '一片祥和', '一片繁华', '一片天', '一片茫茫', '一片雪白', '一片片', '一片海', '一片片的', '一片云', '一片片地', '一片片的秋叶', '一片片的绿叶', '一片片地飘落', '一片天空', '一片田野', '一片片的枫叶', '一片树叶', '一片片的树叶', '一片红叶', '一片片的雪花', '一片云彩', '一片云层', '一片云朵', '一片云霞', '一片白云', '一片绿叶', '一片黄叶', '一片片绿叶', '一片片黄叶', '一片片的云', '一片青草', '一片片的青草', '一片片的红叶', '一片晴天', '一片红', '一片红色', '一片雪', '一片蓝色', '一片黄', '一片黄色', '一片紫色', '一片阳光', '一片雨', '一片树林']
words_cleaned = [word for word in words if word not in stop_words]
# 合并分词结果
text_cleaned = ' '.join(words_cleaned)
# 生成词云图
wordcloud = WordCloud(font_path='msyh.ttc', background_color='white', width=800, height=600).generate(text_cleaned)
# 显示词云图
plt.figure(figsize=(10, 6))
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
```
运行结果:
![《活着》词云图](https://img-blog.csdnimg.cn/20220101183638672/word-cloud.png)
阅读全文