python网络爬虫炫酷词云统计图完整代码
时间: 2024-06-20 17:03:22 浏览: 124
Python 制作酷炫词云图 Python源码
以下是一个简单的 Python 爬虫炫酷词云统计图的完整代码示例:
```python
import requests
from bs4 import BeautifulSoup
import jieba
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
# 1. 获取网页内容
url = "https://www.csdn.net/"
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
# 2. 提取关键词
text = soup.get_text() # 获取网页中的文本内容
words = jieba.cut(text) # 使用jieba库对文本内容进行分词
# 3. 生成词云图
text = " ".join(words) # 将分好的词以空格分隔开并转化为字符串形式
mask = np.array(Image.open("cloud.png")) # 读取词云图模板,可以使用其他图片替换
wc = WordCloud(background_color="white", mask=mask, font_path="simhei.ttf") # 配置词云参数
wc.generate(text) # 生成词云图
# 4. 颜色渐变处理
image_colors = ImageColorGenerator(mask) # 使用模板颜色生成颜色渐变器
wc.recolor(color_func=image_colors) # 将词云图颜色设置为渐变颜色
# 5. 展示词云图
plt.imshow(wc, interpolation="bilinear")
plt.axis("off")
plt.show()
```
阅读全文