首页用xpath和beautifulsoup爬取http://shehui.sanyau.edu.cn/?article/type/60/1.htm前5页l新闻标题和浏览量

用xpath和beautifulsoup爬取http://shehui.sanyau.edu.cn/?article/type/60/1.htm前5页l新闻标题和浏览量

时间: 2023-10-08 15:10:08 浏览: 93

使用BeautifulSoup爬虫程序获取百度搜索结果的标题和url示例

熟悉Java的jsoup包的话，对于Python的BeautifulSoup库应该很容易上手。复制代码代码如下:#coding: utf-8import sysimport urllibimport urllib2from BeautifulSoup import BeautifulSoup question_word = “吃货程序员”url = “http://www.baidu.com/s?wd=” + urllib.quote(question_word.decode(sys.stdin.encoding).encode(‘gbk’))htmlpage = urllib2.url

好的，我可以帮您解决这个问题。以下是Python代码： ``` python import requests from bs4 import BeautifulSoup for page in range(1, 6): url = f"http://shehui.sanyau.edu.cn/?article/type/60/{page}.htm" response = requests.get(url) soup = BeautifulSoup(response.text, "html.parser") articles = soup.find_all("div", class_="article") for article in articles: title = article.find("a").get_text() views = article.find("i").get_text() print(f"标题：{title} 浏览量：{views}") ``` 这段代码将爬取 http://shehui.sanyau.edu.cn/?article/type/60/1.htm 前5页的新闻标题和浏览量，并打印输出。其中使用了 requests 库发送 HTTP 请求，使用了 BeautifulSoup 库进行 HTML 解析，同时使用了 xpath 和 find 方法来筛选出需要的数据。

阅读全文

最新推荐

用xpath和beautifulsoup爬取http://shehui.sanyau.edu.cn/?article/type/60/1.htm前5页l新闻标题和浏览量

相关推荐

用beautifulsoup爬页面

爬虫学习资源，有xpath爬取,beautifulsoup爬取，selenium爬取

用xpath爬取http://shehui.sanyau.edu.cn/?article/type/60/1.html新闻标题和浏览量

利用xpath方式爬取http://10.254.1.123/doubanbook/网站新书信息提交代码和截图

利用xpath方式爬取http://10.254.1.123/doubanbook/网站新书信息 并将爬取的40条书目信息保存为csv

生成python代码利用xpath爬取http://fenqi.renren.com/ 网页信息

采用Request+XPath爬取网站https://qd.lianjia.com/ershoufang/的数据

pyhton 爬取https://bz.feigua.cn/ranking/DailyHotVideoV2/20230725/1/0.html 页面数据

pychram编写一个selenium爬取http://data.cityhouse.cn/rank/index.html?

Python爬取http://tyhx.com.cn/Web/Price太原河西网站上的农副产品的数据，并用xpath数据解析，并保存数据。

爬取http://www.tianqihoubao.com/中北京和某南方城市2023年全年的天气数据

怎么爬取 https://www.taoguba.com.cn/ 网站的信息

python爬取https://www.biedoul.com/页面30页内容代码

使用scrapy框架进行爬取https://movie.douban.com/cinema/later/chongqing/

爬取http://tyhx.com.cn/Web/Price太原河西网站上的农副产品的数据（用beatifulsoup解析）

用selenium爬取https://data.eastmoney.com/xg/xg/?mkt=kzz页面信息

用pycharm爬取http://tyhx.com.cn/Web/Price太原河西网站上的农副产品的数据（用beatifulsoup解析）

使用Python scrapy进行爬取https://movie.douban.com/top250?start=0&filter=并用json文件保存

如何使用selenium爬取https://m.chunyuyisheng.com/qalist/?page=1&high_quality=0中的每一个对话信息

最新推荐

高清艺术文字图标资源，PNG和ICO格式免费下载

管理建模和仿真的文件

DMA技术：绕过CPU实现高效数据传输

SGM8701电压比较器如何在低功耗电池供电系统中实现高效率运作？

mui框架HTML5应用界面组件使用示例教程

"互动学习：行动中的多样性与论文攻读经历"

【数据传输高速公路】：总线系统的深度解析

如何结合PID算法调整PWM信号来优化电机速度控制？请提供实现这一过程的步骤和代码示例。

Vue.js开发利器：chrome-vue-devtools插件解析

关系数据表示学习

利用xpath方式爬取http://10.254.1.123/doubanbook/网站新书信息并将爬取的40条书目信息保存为csv