beautifulsoup用法find_all
时间: 2023-04-26 09:01:45 浏览: 167
python 如何使用find和find_all爬虫、找文本的实现
5星 · 资源好评率100%
beautifulsoup是一个Python库,用于从HTML和XML文件中提取数据。find_all()是beautifulsoup中的一个方法,用于查找所有符合指定标签和属性的元素,并返回一个列表。
例如,如果我们想要从一个HTML文件中提取所有的链接,可以使用以下代码:
```
from bs4 import BeautifulSoup
import requests
url = 'https://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
links = soup.find_all('a')
for link in links:
print(link.get('href'))
```
这段代码首先使用requests库获取网页内容,然后使用BeautifulSoup解析HTML文件。接着,使用find_all()方法查找所有的a标签,并将它们存储在一个列表中。最后,使用一个循环遍历列表,并打印每个链接的href属性。
阅读全文