用python来写一个代码,利用wordcloud库生成词云,分析 http://www.npc.gov.cn/npc/kgfb/202303/670e9366e2614093a734809a04b4ad93.shtml
时间: 2023-12-22 13:03:59 浏览: 90
YOLO算法-城市电杆数据集-496张图像带标签-电杆.zip
好的,以下是使用 Python 和 wordcloud 库生成词云的代码:
```python
import requests
from bs4 import BeautifulSoup
from wordcloud import WordCloud
import jieba
# 获取网页内容
url = 'http://www.npc.gov.cn/npc/kgfb/202303/670e9366e2614093a734809a04b4ad93.shtml'
response = requests.get(url)
html = response.content
# 解析网页内容
soup = BeautifulSoup(html, 'html.parser')
text = soup.get_text()
# 利用 jieba 分词
words = jieba.cut(text)
# 拼接分词结果
result = ' '.join(words)
# 生成词云
wordcloud = WordCloud(background_color='white', font_path='msyh.ttc', width=800, height=600).generate(result)
wordcloud.to_file('wordcloud.png')
```
这个代码首先使用 requests 库获取指定网页的内容,然后使用 BeautifulSoup 库解析网页内容,提取出文本。接着使用 jieba 库对文本进行分词,并将分词结果拼接成一个字符串。最后使用 wordcloud 库生成词云,并将结果保存到本地文件 wordcloud.png 中。在生成词云时,我们指定了词云的背景色为白色,使用了微软雅黑字体,并设置了词云的宽度和高度。你可以根据需要修改这些参数。
阅读全文