python beautifulsoup库获取标签属性的函数
时间: 2023-12-07 17:04:33 浏览: 29
BeautifulSoup库提供了多种方法来获取标签属性,常用的方法有以下三种:
1. `tag.get('属性名')`:获取指定标签的属性值,返回一个字符串,如果属性不存在则返回None。
2. `tag.attrs['属性名']`:获取指定标签的属性值,返回一个字符串,如果属性不存在则会抛出KeyError异常。
3. `tag['属性名']`:获取指定标签的属性值,返回一个字符串,如果属性不存在则会抛出KeyError异常。
例如,假设我们有以下HTML代码:
```html
<div class="container" id="main">
<h1>Hello World</h1>
<p>This is a paragraph.</p>
</div>
```
我们可以使用以下代码来获取`div`标签的`class`属性值:
```python
from bs4 import BeautifulSoup
html = """
<div class="container" id="main">
<h1>Hello World</h1>
<p>This is a paragraph.</p>
</div>
"""
soup = BeautifulSoup(html, 'html.parser')
tag = soup.find('div')
print(tag.get('class')) # 输出:['container']
print(tag.attrs['class']) # 输出:['container']
print(tag['class']) # 输出:['container']
```
以上三个方法都可以获取`class`属性的值,输出结果都是`['container']`。