beautifulsoup获取html标签相关属性
时间: 2023-04-27 21:00:23 浏览: 242
使用BeautifulSoup可以轻松获取HTML标签的相关属性。以下是一些常用的方法:
1. 获取标签的属性值
使用标签对象的get()方法可以获取标签的属性值。例如,如果要获取一个a标签的href属性值,可以使用以下代码:
```
from bs4 import BeautifulSoup
html = '<a href="https://www.baidu.com">百度</a>'
soup = BeautifulSoup(html, 'html.parser')
a_tag = soup.a
href = a_tag.get('href')
print(href)
```
输出结果为:https://www.baidu.com
2. 获取标签的所有属性
使用标签对象的attrs属性可以获取标签的所有属性。例如,如果要获取一个img标签的所有属性,可以使用以下代码:
```
from bs4 import BeautifulSoup
html = '<img src="https://www.baidu.com/img/bd_logo1.png" alt="百度logo">'
soup = BeautifulSoup(html, 'html.parser')
img_tag = soup.img
attrs = img_tag.attrs
print(attrs)
```
输出结果为:{'src': 'https://www.baidu.com/img/bd_logo1.png', 'alt': '百度logo'}
3. 获取标签的文本内容
使用标签对象的text属性可以获取标签的文本内容。例如,如果要获取一个p标签的文本内容,可以使用以下代码:
```
from bs4 import BeautifulSoup
html = '<p>这是一个段落</p>'
soup = BeautifulSoup(html, 'html.parser')
p_tag = soup.p
text = p_tag.text
print(text)
```
输出结果为:这是一个段落
以上是一些常用的方法,使用BeautifulSoup可以方便地获取HTML标签的相关属性。
阅读全文