import requests from bs4 import BeautifulSoup import lxml headers = { "User-Agent": "Mozilla/5.0 (Macintosh; Intel)" } for start_name in range(0, 250, 25): res = requests.get(f"https://book.douban.com/top250?start=", headers=headers) print(res.status_code) soup = BeautifulSoup(res.text, 'lxml') t1 = soup.findAll('div', attrs={'class': 'pl2'}) for i in t1: t2 = i.find('a') print(t2) break；去除输出<a>中的空格

时间: 2023-06-19 18:03:24 浏览: 359

可以在输出 t2 之前使用 strip() 方法去除字符串两端的空格，例如： ```python for start_name in range(0, 250, 25): res = requests.get(f"https://book.douban.com/top250?start={start_name}", headers=headers) print(res.status_code) soup = BeautifulSoup(res.text, 'lxml') t1 = soup.findAll('div', attrs={'class': 'pl2'}) for i in t1: t2 = i.find('a').text.strip() # 去除<a>标签中的空格 print(t2) break ``` 这样输出的 t2 就不会包含空格了。

统计下列代码中info中的数据个数import requests from bs4 import BeautifulSoup headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.41'} url='https://www.ibiquges.com/xiaoshuodaquan/' strhtml=requests.get(url,headers=headers) soup=BeautifulSoup(strhtml.text,'lxml') info=soup.select('#main > div:nth-child(1) > ul') count=0 for item in info: print(item.get_text()) count=count+1 print(count)

根据给出的代码，我们可以看到从指定的网站中获取到页面的 HTML 代码，并使用 BeautifulSoup 库进行解析。接着使用 CSS 选择器定位到 id 为 "main" 的元素的第一个子元素 ul，并将其赋值给变量 info。最后使用 for 循环遍历 info 中的每个元素，并打印元素的文本内容，同时累加计数器 count 的值。因此，info 中的数据个数取决于网站中 id 为 "main" 的元素的第一个子元素 ul 中的数据个数。无法确定具体的数据个数。

下列代码中统计id为 "main" 的元素的第一个子元素 ul下的元素个数import requests from bs4 import BeautifulSoup headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.41'} url='https://www.ibiquges.com/xiaoshuodaquan/' strhtml=requests.get(url,headers=headers) soup=BeautifulSoup(strhtml.text,'lxml') info=soup.select('#main > div:nth-child(1) > ul') for item in info: print(item.get_text())

可以使用 Python 的内置函数 len() 统计 id 为 "main" 的元素的第一个子元素 ul 下的元素个数。代码如下： ``` import requests from bs4 import BeautifulSoup headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.41'} url = 'https://www.ibiquges.com/xiaoshuodaquan/' strhtml = requests.get(url, headers=headers) soup = BeautifulSoup(strhtml.text, 'lxml') info = soup.select('#main > div:nth-child(1) > ul') count = len(info[0].find_all('li')) print(count) ``` 首先，我们使用 len() 函数统计了 info 列表中第一个元素中的 li 元素的个数，并将结果赋值给变量 count。其中，find_all() 方法返回一个列表，其中包含所有匹配的元素。接着使用 print() 函数打印结果即可。

阅读全文

相关推荐

import sys import os import urllib from bs4 import BeautifulSoup

python爬虫代码（requests、BeautifulSoup）.docx

2015-2024软考中级信息安全工程师视频教程网课程真题库课件复习材料.zip

智慧城市安防-YOLOv11夜间低光环境下的异常行为检测实战.pdf

农业智能化革命-YOLOv11实现多作物叶片实时分割与表型分析.pdf

大家在看

AGV硬件设计概述.pptx

DSR.rar_MANET DSR_dsr_dsr manet_it_manet

VITA 62.0.docx

年终活动抽奖程序，随机动画变化

形成停止条件-c#导出pdf格式

最新推荐

2015-2024软考中级信息安全工程师视频教程网课程真题库课件复习材料.zip

Spring Websocket快速实现与SSMTest实战应用

电力电子技术的智能化：数据中心的智能电源管理

通过spark sql读取关系型数据库mysql中的数据

新版微软inspect工具下载：32位与64位版本

如何运用电力电子技术实现IT设备的能耗监控

2635.656845多位小数数字，js不使用四舍五入保留两位小数，然后把结果千分位，想要的结果是2,635.65;如何处理

解决最小倍数问题 - Ruby编程项目欧拉实践

电力电子技术：IT数据中心的能源革命者

设计一个程序，实现哈希表的相关运算：用Java语言编写