三国演义高频词python
时间: 2023-10-15 20:27:52 浏览: 55
根据引用和引用,我们可以通过对三国演义进行中文分词,然后统计高频词的出现次数,来得到高频词。而根据引用中提到的问题解决方法,我们可以使用Python来解决显示中文乱码的问题。
首先,我们需要使用Python中的中文分词库,如jieba,对三国演义进行分词。然后,我们可以使用collections模块中的Counter函数来统计每个词的出现次数。接下来,我们可以根据出现次数对词频进行排序,找出前十个高频词。最后,我们可以使用matplotlib库来绘制高频词的条形图。
下面是一个示例代码来实现上述过程:
```python
import jieba
from collections import Counter
import matplotlib.pyplot as plt
from wordcloud import WordCloud
# 读取三国演义文本
with open('sanguoyanyi.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 进行中文分词
words = jieba.cut(text)
# 统计词频
word_counts = Counter(words)
# 获取前十个高频词
top_ten = word_counts.most_common(10)
# 打印高频词和出现次数
for word, count in top_ten:
print(word, count)
# 绘制条形图
words, counts = zip(*top_ten)
plt.bar(words, counts)
plt.xlabel('词语')
plt.ylabel('出现次数')
plt.title('三国演义前十高频词')
plt.show()
# 生成词云图
wordcloud = WordCloud(font_path='C:/Windows/Fonts/SimHei.ttf').generate(text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
请注意,上述代码中使用的示例文本文件为`sanguoyanyi.txt`,你需要将其替换为你自己的三国演义文本文件路径。
这样,你就可以得到三国演义的高频词python,并且绘制出高频词的条形图和词云图了。希望对你有所帮助!<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [分析三国演义和红楼梦,进行中文分词,统计人物出场频次,生成词云图](https://download.csdn.net/download/m0_46653437/13016183)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [python统计三国高频词,画条形图,绘词云图](https://blog.csdn.net/qq_47289634/article/details/130837802)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]