文本词频统计,词云图的制作代码
时间: 2024-03-14 07:46:46 浏览: 70
好的,以下是基于Python的文本词频统计和词云图制作的代码:
1. 文本词频统计
```python
import re
from collections import Counter
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 去除标点符号和换行符
text = re.sub(r'[^\w\s]', '', text)
text = re.sub(r'\n', ' ', text)
# 转换为小写
text = text.lower()
# 统计词频
word_counts = Counter(text.split())
# 输出前10个高频词
for word, count in word_counts.most_common(10):
print(word, count)
```
2. 词云图制作
```python
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 去除标点符号和换行符
text = re.sub(r'[^\w\s]', '', text)
text = re.sub(r'\n', ' ', text)
# 转换为小写
text = text.lower()
# 生成词云图
wordcloud = WordCloud(width=800, height=800, background_color='white').generate(text)
# 显示词云图
plt.figure(figsize=(8,8))
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
```
需要注意的是,以上代码中需要安装WordCloud库和matplotlib库,可以使用以下命令进行安装:
```python
pip install wordcloud matplotlib
```
另外,需要将text.txt替换为需要统计词频和制作词云图的文本文件。
阅读全文