首页编写代码爬取学校官网关于学习20大精神的新闻信息，并且生成词云。

编写代码爬取学校官网关于学习20大精神的新闻信息，并且生成词云。

时间: 2024-06-09 20:07:53 浏览: 126

词云的生成代码

用python写的词云生成代码，python2.7 使用了jieba 包，然后是jupytor notebook 写的

这里提供一个Python的爬虫和词云生成的示例代码，具体实现需要根据学校官网的具体情况进行修改。以下代码需要安装BeautifulSoup4、jieba和wordcloud这三个库。 ```python import requests from bs4 import BeautifulSoup import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 爬取新闻 url = 'https://news.sjtu.edu.cn/jdyw/1.htm' response = requests.get(url) response.encoding = 'utf-8' soup = BeautifulSoup(response.text, 'html.parser') news_list = soup.find_all('div', class_='news_list') words = '' for news in news_list: if '学习20大精神' in news.a.text: news_url = news.a['href'] news_response = requests.get(news_url) news_response.encoding = 'utf-8' news_soup = BeautifulSoup(news_response.text, 'html.parser') news_content = news_soup.find('div', class_='content').text.strip() words += news_content # 分词 stopwords = set(['的', '了', '和', '是', '在', '等', '有', '就', '也', '与', '为', '要', '这', '与', '及', '以', '对', '不', '中']) word_list = list(jieba.cut(words)) word_list = [word for word in word_list if word not in stopwords] # 生成词云 wordcloud = WordCloud(font_path='msyh.ttc', background_color='white', max_words=200).generate(' '.join(word_list)) plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() ``` 在上述代码中，我们首先使用requests和BeautifulSoup库爬取学校官网上的新闻，然后使用jieba库进行分词，最后使用wordcloud库生成词云并展示。需要注意的是，这里的词云字体使用了微软雅黑，需要在代码所在的目录下有msyh.ttc文件。如果没有该字体文件，可以将其替换为其他中文字体。

阅读全文

最新推荐

利用Python爬取微博数据生成词云图片实例代码

python 爬取豆瓣电影评论，并进行词云展示

编写代码爬取学校官网关于学习20大精神的新 闻信息，并且生成词云。

相关推荐

学校网站开发代码

校园官网基于关键词的每日新闻爬虫

编写代码爬取长春理工大学官网关于学习20大精神的新闻信息，并且生成词云。

利用Python爬取微博数据生成词云图片实例代码

QQ-Music爬虫python爬取数据生成词云.rar

Python爬取bilibili弹幕生成词云教程项目

Python生成词云的实现代码

豆瓣爬取影评并转换成词云的代码

Python实战应用代码-爬取电视剧赘婿评论-词云分析

Python源码实例-生成词云图.zip

python分析2022春节贺岁档电影并根据评论生成词云

python 爬取豆瓣电影评论，并进行词云展示

豆瓣最受欢迎影评爬取与词云生成教程

Python爬虫实战：新浪微博数据爬取与词云生成

用Python爬虫抓取豆瓣影评并生成词云图

携程游记数据爬取与词云可视化分析

使用python和chrome浏览器爬取近两天的微博热搜，并进行分词，生成词云图。

Python编写与某个人微信聊天记录生成词云图片

最新推荐

利用Python爬取微博数据生成词云图片实例代码

python 爬取豆瓣电影评论，并进行词云展示

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

"互动学习：行动中的多样性与论文攻读经历"

编写代码爬取学校官网关于学习20大精神的新闻信息，并且生成词云。