使用requests库发送GET请求,获取网页的HTML内容、标题内容。
时间: 2024-10-11 15:07:10 浏览: 47
一个简单的Python爬虫脚本,使用requests库来发送HTTP请求,并使用BeautifulSoup库来解析HTML内容
在Python中,`requests`库是一个非常方便的工具,用于处理HTTP请求。如果你想通过GET请求获取网页的HTML内容和标题,可以按照以下步骤操作:
首先,你需要安装requests库,如果还没有安装,可以使用pip进行安装:
```bash
pip install requests
```
然后,你可以使用以下代码片段发送GET请求并解析响应:
```python
import requests
# 发送GET请求到指定URL
url = 'https://www.example.com' # 替换为你想获取的网站地址
response = requests.get(url)
# 检查请求是否成功(状态码为200表示成功)
if response.status_code == 200:
# 获取HTML内容
html_content = response.text
# 解析HTML内容获取页面标题(假设标题在<h1>标签内)
soup = BeautifulSoup(html_content, 'html.parser')
title = soup.find('h1').text
print("标题:", title)
print("HTML内容:\n", html_content)
else:
print(f"请求失败,状态码:{response.status_code}")
阅读全文