python环境,用get请求,获取网页源文件
时间: 2024-03-29 18:41:07 浏览: 12
好的,以下是一个使用 Python 发送 GET 请求获取网页源文件的示例代码:
```python
import requests
url = 'https://www.example.com/index.html'
response = requests.get(url) # 发送 GET 请求并获取响应对象
html = response.text # 获取网页源文件
print(html) # 输出网页源文件
```
在这个示例中,我们使用 requests 库发送了一个 GET 请求,指定了目标网页的 URL 地址,并获取了响应对象。其中,`response.text` 方法可以获取到网页的源文件内容,保存在 `html` 变量中。最后,我们将网页源文件输出到控制台,以便查看。
需要注意的是,在实际使用中,我们可能需要对请求头进行一些设置,以模拟浏览器的行为,避免被网站屏蔽。比如:
```python
import requests
url = 'https://www.example.com/index.html'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
response = requests.get(url, headers=headers) # 发送 GET 请求并设置请求头
html = response.text # 获取网页源文件
print(html) # 输出网页源文件
```
在这个示例中,我们设置了一个请求头,模拟了 Chrome 浏览器的 User-Agent 信息,以便更好地伪装成浏览器进行访问。