使用requests库爬取学校主页; 将爬取的html文字内容存储在D盘的xynu.txt文档里。
时间: 2024-03-20 19:39:40 浏览: 49
好的,我可以帮你写一个Python脚本来完成这个任务。请先安装好requests库。
```
import requests
# 发送 GET 请求
url = 'http://www.xynu.edu.cn/'
response = requests.get(url)
# 将响应的内容写入文件
with open('D:\\xynu.txt', 'w', encoding='utf-8') as f:
f.write(response.text)
```
上面这段代码中,我们首先使用requests库发送了一个GET请求,获取了学校主页的HTML内容。然后通过Python内置的`with open()`语句,将获取到的内容写入到D盘下的xynu.txt文档中。注意,我们需要指定文件的编码格式为utf-8,这样能够避免中文乱码的问题。
相关问题
将爬取的html文宇内容存储在D盘的xynu.txt文档里。
好的,你可以使用Python的文件操作来实现将爬取的HTML内容存储到本地文件中。以下是示例代码:
```python
import requests
url = 'https://www.xynu.edu.cn/'
response = requests.get(url)
if response.status_code == 200:
# 将爬取到的HTML文本内容写入文件
with open('D:/xynu.txt', 'w', encoding='utf-8') as f:
f.write(response.text)
print('爬取成功并已保存到D:/xynu.txt')
else:
print('请求失败')
```
这段代码除了发送GET请求到https://www.xynu.edu.cn/外,还会将响应的HTML文本内容写入到D盘的xynu.txt文件中。你需要确保D盘下的路径存在,否则会抛出文件不存在的错误。
使用requests库爬取https://www.xynu.edu.cn/
好的,以下是使用requests库爬取https://www.xynu.edu.cn/的示例代码:
```python
import requests
url = 'https://www.xynu.edu.cn/'
response = requests.get(url)
if response.status_code == 200:
print(response.text)
else:
print('请求失败')
```
这段代码会发送一个GET请求到https://www.xynu.edu.cn/,并将响应内容打印出来。如果请求成功,响应状态码会是200,否则就会输出"请求失败"。你可以根据自己的需要对这段代码进行修改和扩展。
阅读全文