bs4 网页文本中筛选 属性为class="style5" width="20%" 的td字段的值
时间: 2024-09-30 20:15:56 浏览: 39
BS EN 15085-4:2023 中文 铁路应用-轨道车辆及其部件的焊接-第 4 部分: 制造要求.rar
5星 · 资源好评率100%
在BeautifulSoup库中,如果你想要从HTML网页中筛选出所有`<td>`元素,它们的`class`属性等于`style5`并且`width`属性等于`20%`,你可以这样做:
首先,确保已经导入了BeautifulSoup和requests库,然后按照以下步骤操作:
```python
import requests
from bs4 import BeautifulSoup
# 发送HTTP请求获取网页内容
url = 'http://example.com' # 替换为你想抓取的网站URL
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(html_content, 'html.parser')
# 筛选出符合条件的<td>元素
tds_style5_20_percent = soup.find_all('td', class_='style5', attrs={'width': '20%'})
# 遍历提取<td>元素的值
values = [td.get_text() for td in tds_style5_20_percent]
# 输出或进一步处理提取到的值
print(values)
阅读全文