find_all函数如何使用
时间: 2024-05-02 19:16:52 浏览: 126
`find_all` 函数是 BeautifulSoup 库中用于查找所有符合条件的标签的函数。它的一般语法如下:
```python
find_all(name=None, attrs={}, recursive=True, string=None, limit=None, **kwargs)
```
其中:
- `name`:标签名或标签名列表,可选参数。
- `attrs`:标签属性字典,可选参数。
- `recursive`:是否递归查找子孙标签,默认为 True。
- `string`:标签包含的文本内容,可选参数。
- `limit`:返回的结果数量限制,默认为 None。
- `**kwargs`:其它属性参数,可选参数。
使用示例:
```python
from bs4 import BeautifulSoup
html = """
<html>
<head>
<title>BeautifulSoup</title>
</head>
<body>
<div class="content">
<h1>BeautifulSoup</h1>
<p class="intro">BeautifulSoup 是一个Python库</p>
<ul>
<li class="item">提供了一些简单的方法</li>
<li class="item">用于抓取HTML和XML文件中的数据</li>
<li class="item">适合初学者</li>
</ul>
</div>
</body>
</html>
"""
soup = BeautifulSoup(html, 'lxml')
# 查找所有的 li 标签
lis = soup.find_all('li')
for li in lis:
print(li.string)
# 查找 class 为 item 的 li 标签
items = soup.find_all('li', attrs={'class': 'item'})
for item in items:
print(item.string)
```
输出结果:
```
提供了一些简单的方法
用于抓取HTML和XML文件中的数据
适合初学者
提供了一些简单的方法
用于抓取HTML和XML文件中的数据
适合初学者
```
阅读全文