Beautiful Soup 访问标签class
时间: 2024-06-15 12:07:44 浏览: 91
BeautifulSoup 获取 a标签里的文本内容
Beautiful Soup是一个Python库,用于从HTML或XML文档中提取数据。它提供了一种简单而灵活的方式来遍历、搜索和修改文档树。
要访问标签的class属性,可以使用Beautiful Soup提供的find_all()方法或select()方法。这两种方法都可以根据标签名和属性值进行筛选。
使用find_all()方法时,可以传入一个字典作为参数,其中键为属性名,值为属性值。例如,要找到class属性为"example"的所有标签,可以使用以下代码:
```python
from bs4 import BeautifulSoup
html = '''
<html>
<body>
<div class="example">This is an example</div>
<p class="example">This is another example</p>
</body>
</html>
'''
soup = BeautifulSoup(html, 'html.parser')
tags = soup.find_all('div', {'class': 'example'})
for tag in tags:
print(tag.text)
```
使用select()方法时,可以使用CSS选择器语法来选择标签。要找到class属性为"example"的所有标签,可以使用以下代码:
```python
from bs4 import BeautifulSoup
html = '''
<html>
<body>
<div class="example">This is an example</div>
<p class="example">This is another example</p>
</body>
</html>
'''
soup = BeautifulSoup(html, 'html.parser')
tags = soup.select('.example')
for tag in tags:
print(tag.text)
```
以上代码中,通过传入".example"作为参数,选择了所有class属性为"example"的标签,并打印出它们的文本内容。
阅读全文