写一个pyhton wordcloud爬取当前网站制作图云的代码
时间: 2023-06-09 18:02:01 浏览: 97
pyhton圣诞树代码
以下是可以用来爬取网站数据并制作词云的 Python 代码:
```python
import requests
import jieba
from wordcloud import WordCloud
# 爬取目标网站内容
response = requests.get("https://example.com")
text = response.text
# 使用 jieba 库对中文文本进行分词
words = jieba.cut(text)
# 将分词结果转为列表,并清除不需要的词汇
filtered_words = []
for word in words:
if len(word) > 1 and word != '\r\n':
filtered_words.append(word)
# 将列表中的词汇拼接为一个字符串
text = ' '.join(filtered_words)
# 生成词云图并保存
wordcloud = WordCloud(font_path='simhei.ttf').generate(text)
wordcloud.to_file('wordcloud.png')
```
当然,这只是一个简单的示例代码,具体实现要根据不同的网站,采取不同的爬取方式和数据清洗方式,以及适当修改词云的参数来得到更好的效果。同时,需要注意遵守网站的爬虫规则,不要对网站造成损失或侵犯其利益。
阅读全文