pycharm对Excel去停用词后生成词云图
时间: 2023-10-06 22:12:26 浏览: 146
要在PyCharm中对Excel去停用词后生成词云图,你可以按照以下步骤操作:
1. 安装所需库:`openpyxl`、`nltk`和`wordcloud`。你可以在PyCharm的内置终端中使用`pip`命令来安装它们:
```
pip install openpyxl nltk wordcloud
```
2. 在PyCharm中创建一个新的Python文件,然后导入所需库:
```python
import openpyxl
from nltk.corpus import stopwords
from wordcloud import WordCloud
```
3. 读取Excel文件并去停用词:
```python
# 读取Excel文件
workbook = openpyxl.load_workbook('example.xlsx')
worksheet = workbook.active
# 将所有单元格的内容拼接成一个字符串
text = ''
for row in worksheet.iter_rows(values_only=True):
for cell in row:
if isinstance(cell, str):
text += cell.lower() + ' '
# 去停用词
stop_words = set(stopwords.words('english'))
words = [word for word in text.split() if word not in stop_words]
new_text = ' '.join(words)
```
4. 生成词云图并保存为图片:
```python
# 生成词云图
wordcloud = WordCloud(background_color='white').generate(new_text)
# 保存为图片
wordcloud.to_file('wordcloud.png')
```
请注意,你需要将`example.xlsx`替换为你的实际Excel文件名,并将`wordcloud.png`替换为你想要保存的文件名。同时,你也可以根据需要自定义词云图的其他参数,例如颜色、形状、字体等。
阅读全文