lxml requests
时间: 2023-11-09 08:01:07 浏览: 145
Requests+lxml数据采集
lxml是一个Python库,用于处理XML和HTML文档。它提供了一组API,使得解析和操作XML和HTML文档变得非常容易。requests是另一个Python库,用于发送HTTP请求。它允许您发送HTTP/1.1请求,包括GET、POST、PUT、DELETE等方法,以及HTTP头和数据。
使用lxml和requests可以轻松地从网页中提取数据。首先,使用requests库发送HTTP请求,然后使用lxml库解析响应内容。例如,以下代码从网页中提取所有链接:
```python
import requests
from lxml import html
url = 'https://www.example.com'
response = requests.get(url)
tree = html.fromstring(response.content)
links = tree.xpath('//a/@href')
print(links)
```
阅读全文