python统计excel文本单元格_Python统计excel表格中文本的词频,生成词云图片
时间: 2023-07-21 12:44:47 浏览: 88
可以使用Python中的pandas、jieba和wordcloud模块来实现这个功能。具体步骤如下:
1. 使用pandas读取Excel表格,并将需要统计的文本单元格读取到一个列表中。
```python
import pandas as pd
df = pd.read_excel('example.xlsx')
text_list = df['text'].tolist()
```
2. 使用jieba对文本进行分词,计算词频,并将结果保存到一个字典中。
```python
import jieba
word_dict = {}
for text in text_list:
seg_list = jieba.cut(text)
for word in seg_list:
if word in word_dict:
word_dict[word] += 1
else:
word_dict[word] = 1
```
3. 使用wordcloud生成词云图片,并保存到本地。
```python
from wordcloud import WordCloud
import matplotlib.pyplot as plt
wc = WordCloud(width=800, height=600, background_color='white')
wc.generate_from_frequencies(word_dict)
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()
wc.to_file('wordcloud.png')
```
这样就可以生成一个统计了文本单元格词频的词云图片了。