如何将一列dataframe中的中文数据绘制词云图
时间: 2024-05-08 21:20:05 浏览: 174
用Python做中文分词和绘制词云图
您可以使用Python中的`wordcloud`库来绘制词云图。以下是一个示例代码,它使用`pandas`库读取一列中文数据,使用`jieba`库对文本进行分词,然后使用`wordcloud`库绘制词云图。
```
import pandas as pd
import jieba
from wordcloud import WordCloud
df = pd.read_excel('data.xlsx') # 读取Excel文件,注意修改文件名和路径
text = ''.join(df['中文数据'].tolist()) # 将一列中文数据连接成一个字符串
stopwords = ['的', '它们', '因为'] # 设置停用词,可根据实际情况扩展
# 对文本进行分词,并去除停用词
words = [w for w in jieba.cut(text) if w not in stopwords]
new_text = ' '.join(words)
# 使用wordcloud库生成词云图
wordcloud = WordCloud(font_path='msyh.ttc', background_color='white', width=800, height=600).generate(new_text)
wordcloud.to_file('wordcloud.png') # 保存词云图,注意修改文件名和路径
```
该代码将生成一个名为`wordcloud.png`的词云图,其中包含来自DataFrame列中的中文文本。注意,您需要安装`pandas`、`jieba`和`wordcloud`库来运行此代码。
阅读全文