利用python制作词云图
时间: 2023-12-01 14:59:29 浏览: 120
制作词云图可以使用Python中的`wordcloud`库。以下是一个简单的例子:
```python
# 导入所需库
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 生成词云图
wordcloud = WordCloud(background_color='white', width=800, height=600).generate(text)
# 显示词云图
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
```
其中,`text.txt`为要制作词云图的文本文件名。需要注意的是,如果文本文件中包含中文,需要指定文件编码为`utf-8`。
如果要对词云图进行更多的自定义设置,可以修改`WordCloud`函数中的参数。例如,`background_color`参数可以设置词云图的背景颜色,`width`和`height`参数可以设置词云图的大小等。更多参数可以参考`wordcloud`库的官方文档。
相关问题
利用python制作词云图,背景为树叶
制作词云图需要使用到 wordcloud 库,而制作背景为树叶的词云图,则需要使用到 mask 参数来指定背景图片。以下是一个简单的示例代码:
```python
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
# 读入文本
text = open('example.txt', 'r', encoding='utf-8').read()
# 读入背景图片
mask = np.array(Image.open('leaf.jpg'))
# 设置停用词
stopwords = set(STOPWORDS)
stopwords.add('said')
# 构建词云对象
wc = WordCloud(background_color='white', max_words=2000, mask=mask, stopwords=stopwords)
# 生成词云
wc.generate(text)
# 保存词云图片
wc.to_file('wordcloud.png')
# 显示词云图片
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()
```
在上述代码中,我们首先读入了文本文件和背景图片,设置了停用词。然后,我们构建了一个词云对象,指定了背景颜色、最大词数、背景图片和停用词。接着,我们调用了 generate 方法生成词云,并使用 to_file 方法将词云保存为图片。最后,我们使用 imshow 方法和 axis 方法显示词云图片,并关闭坐标轴。
利用python做词云图的代码
以下是利用Python制作词云图的示例代码:
```python
# 导入需要的库
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
import jieba
# 加载文本数据,这里以读取txt文件为例
with open('text.txt', 'r', encoding='utf-8') as f:
data = f.read()
# 对文本进行分词处理
words = ' '.join(jieba.cut(data))
# 定义停用词
stopwords = set(STOPWORDS)
# 自定义词云图背景色、字体、停用词等参数
wc = WordCloud(
background_color='white',
stopwords=stopwords,
font_path='msyh.ttc',
max_words=200,
max_font_size=100,
width=800,
height=800,
random_state=30
)
# 生成词云图
wc.generate(words)
# 绘制词云图
plt.imshow(wc)
plt.axis('off')
plt.show()
```
其中,需要安装的库有WordCloud、matplotlib、jieba等,可以使用pip进行安装。对于文本数据,可以是txt、csv等格式的文件,或者从其他来源获取。在分词处理中,使用jieba库进行中文分词,也可以使用其他分词工具。在自定义词云图参数时,可以根据具体需要进行调整。最终生成的词云图可以保存为图片文件,也可以直接显示在程序中。
阅读全文