请基于python写一个读取csv文件并进行词频统计和词云图可视化
时间: 2024-03-27 19:35:34 浏览: 149
基于python的词频统计源码
好的,以下是一个基于Python的读取CSV文件并进行词频统计和词云图可视化的示例代码:
```python
import pandas as pd
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取CSV文件
df = pd.read_csv('example.csv', encoding='utf-8')
# 统计词频
word_counts = Counter(df['text'])
# 生成词云图
wordcloud = WordCloud(background_color="white", width=800, height=400).generate_from_frequencies(word_counts)
# 显示词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
```
其中,假设你的CSV文件名为`example.csv`,包含一列名为`text`的文本数据。首先使用`pandas`库读取CSV文件,然后使用`collections`库中的`Counter`函数进行词频统计。接着使用`wordcloud`库生成词云图,并使用`matplotlib`库中的`imshow`函数和`show`函数显示词云图。
需要注意的是,这里使用了`WordCloud`类的`generate_from_frequencies`方法来生成词云图。这个方法接受一个字典作为参数,字典中的键为词语,值为词频。因此,在进行词频统计后,需要将结果转换为字典形式。
阅读全文