python beautifulsoup案例
时间: 2023-06-05 10:48:03 浏览: 137
Python Beautiful Soup 是一个用于解析 HTML 和 XML 文档的 Python 库。它可以帮助我们从网页中提取出需要的数据,例如链接、图片、文本等等。它的使用非常简单,只需要安装库并导入即可。下面是一个 Python Beautiful Soup 的案例:
假设我们要从一个网页中提取出所有的链接,我们可以使用以下代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.baidu.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
links = []
for link in soup.find_all('a'):
links.append(link.get('href'))
print(links)
```
这段代码首先使用 requests 库获取了百度首页的 HTML 内容,然后使用 BeautifulSoup 解析 HTML。接着,我们使用 find_all 方法找到所有的 a 标签,然后使用 get 方法获取每个标签的 href 属性,最后将所有链接保存在一个列表中并打印出来。
这只是 Python Beautiful Soup 的一个简单案例,它还有很多其他的用法,例如解析 XML、查找特定标签、过滤标签等等。如果你想深入了解 Python Beautiful Soup,可以查看官方文档或者参考其他教程。
阅读全文