HTMLSession() 怎么用
时间: 2024-05-18 07:17:24 浏览: 121
HttpSession的使用
`HTMLSession()` 是 `requests_html` 库中的一个类,可以用来发送 HTTP 请求,获取 HTML 页面内容,并支持解析 HTML 页面内容中的数据。以下是使用 `HTMLSession()` 发送 GET 请求并解析页面内容的示例代码:
```python
from requests_html import HTMLSession
# 创建一个 HTMLSession 实例
session = HTMLSession()
# 发送 GET 请求,并获取页面内容
response = session.get('https://www.example.com')
# 解析页面内容中的标题
title = response.html.find('title', first=True).text
print(title)
```
在上面的示例代码中,我们首先创建了一个 `HTMLSession` 实例,然后使用 `get()` 方法发送了一个 GET 请求,并将响应结果保存在 `response` 变量中。接下来,我们使用 `html` 属性获取页面内容,并使用 `find()` 方法查找页面中的标题标签,并将结果保存在 `title` 变量中。最后,我们输出了标题的文本内容。
需要注意的是, `requests_html` 库需要依赖 `pyppeteer` 或 `selenium` 两个库之一来执行 JavaScript 代码,因此在使用前需要确保安装了这两个库中的至少一个。
阅读全文