首页news_list = soup.find_all("a", class_="news_list_title") for news in news_list: title = news.get_text() link = news.get("href") news_response = requests.get(link) news_soup = BeautifulSoup(news_response.content, "html.parser") content = news_soup.find("div", class_="news_content").get_text() if "公示" in title: ws.append([title, link, content])

news_list = soup.find_all("a", class_="news_list_title") for news in news_list: title = news.get_text() link = news.get("href") news_response = requests.get(link) news_soup = BeautifulSoup(news_response.content, "html.parser") content = news_soup.find("div", class_="news_content").get_text() if "公示" in title: ws.append([title, link, content])

时间: 2024-03-18 13:43:43 浏览: 91

newsList.jsp

这段代码的作用是爬取一个网页中的新闻列表，然后获取每个新闻的标题、链接和内容，并将包含关键词“公示”的新闻信息写入一个 Excel 表格中。具体来说，代码通过 BeautifulSoup 库解析 HTML 页面，获取 class 属性为"news_list_title"的所有a标签，然后遍历每个a标签，获取其标题和链接，随后请求链接，解析新闻详细页面，获取新闻内容，最后判断标题中是否包含关键词“公示”，如果包含，则将新闻的标题、链接和内容写入一个 Excel 表格中。

阅读全文

最新推荐

单项海洋环境影响评价等级表.docx

相关推荐

html.rar_python html

URL.rar_url_动态网页下载_网页 取 图片

需要完整的代码，比如爬取https://www.enread.com/news/business/list_188.html

写一个requests爬取https://www.fjmotor.com.cn/allnews_list/tpid_10.html该网站的代码

用BeautifulSoup实现对http://news.imnu.edu.cn/的爬取

用python从交大新闻网主页新闻栏目(http://news.xjtu.edu.cn/zyxw.htm)爬取最新的100 条新闻的代码，并保存在news.txt文件中

用python从交大新闻网主页新闻栏目(http://news.xjtu.edu.cn/zyxw.htm)爬取最新的100 条新闻内容的代码，并保存在news.txt文件中

python搜索新浪新闻，输入关键字如“霜降”点击搜索 https://news.sina.com.cn/

用python中的scripy从交大新闻网主页新闻栏目(http://news.xjtu.edu.cn/zyxw.htm)爬取最新的100 条新闻内容的代码，并保存在news.txt文件中

数据分析搜索新浪新闻，输入关键字如“霜降”点击搜索 https://news.sina.com.cn/ 使用python

从交大新闻网主页新闻栏目(http://news.xjtu.edu.cn/zyxw.htm)爬取最新的100 条新闻

最新推荐

单项海洋环境影响评价等级表.docx

俄罗斯RTSD数据集实现交通标志实时检测

管理建模和仿真的文件

预测区间与置信区间：机器学习中的差异与联系

基于KNN通过摄像头实现0-9的识别python代码

易语言开发的文件批量改名工具使用Ex_Dui美化界面

"互动学习：行动中的多样性与论文攻读经历"

【机器学习预测区间入门】：从概念到实现

如何修改QSpinBox的文字颜色？

爱心援助动态网页教程：前端开发实战指南

URL.rar_url_动态网页下载_网页取图片