python根据提示,在右侧编辑器 Begin-End 区间补充代码,完善函数 get_html() ,用 requests.get 请求获取网页信息。代码
时间: 2024-11-09 13:24:17 浏览: 38
要在Python中根据提示完善 `get_html()` 函数,使其使用 `requests.get()` 请求获取网页信息,参考以下代码:
```python
import requests
def get_html(url, headers={}): # 提供默认的空字典给headers,可自定义请求头
"""
获取网页的HTML内容
:param url: URL 地址
:param headers: 请求头,可选,默认为空字典
:return: 返回获取到的HTML内容
"""
# 补充请求头(如果需要特定头部)
if not headers:
headers = {'User-Agent': 'Mozilla/5.0'} # 示例:添加用户代理,伪装成常见的浏览器
try: # 添加异常处理,以防网络问题或服务器错误
response = requests.get(url, headers=headers) # 发送GET请求
response.raise_for_status() # 如果响应状态不是200,抛出异常
except requests.exceptions.RequestException as e:
print(f"请求失败: {e}")
return None # 或者返回一个错误消息或者None
# 获取网页信息文本
html_content = response.text
# 返回HTML内容
return html_content
# 示例调用:
url = "https://www.example.com"
html = get_html(url)
```
在这个版本中,我们添加了对请求头的设置,使用了异常处理来捕获可能出现的问题,以及返回实际获取到的HTML内容。如果需要进一步定制请求,可以在 `headers` 参数中添加更多的键值对。
阅读全文