使用requests库爬取学校主页; 将爬取的html文字内容存储在D盘的xynu.txt文档里
时间: 2024-04-05 20:31:42 浏览: 44
好的,以下是Python代码实现:
```python
import requests
url = "http://www.xynu.edu.cn/" # 学校主页的URL地址
response = requests.get(url)
# 将爬取的html内容保存在本地文件中
with open("D:/xynu.txt", "w", encoding="utf-8") as file:
file.write(response.text)
```
解释一下上面的代码:
1. 首先导入requests库,用于向学校主页发送HTTP请求并获取响应。
2. 定义变量`url`存储学校主页的URL地址。
3. 通过`requests.get()`方法向学校主页发送GET请求,并将返回的响应对象保存在`response`变量中。
4. 使用`with open()`语句以写入模式打开本地文件,在`D:/xynu.txt`文件中写入爬取到的html内容。
5. 关闭文件。
相关问题
使用requests库爬取学校主页; 将爬取的html文字内容存储在D盘的xynu.txt文档里。
好的,我可以帮你写一个Python脚本来完成这个任务。请先安装好requests库。
```
import requests
# 发送 GET 请求
url = 'http://www.xynu.edu.cn/'
response = requests.get(url)
# 将响应的内容写入文件
with open('D:\\xynu.txt', 'w', encoding='utf-8') as f:
f.write(response.text)
```
上面这段代码中,我们首先使用requests库发送了一个GET请求,获取了学校主页的HTML内容。然后通过Python内置的`with open()`语句,将获取到的内容写入到D盘下的xynu.txt文档中。注意,我们需要指定文件的编码格式为utf-8,这样能够避免中文乱码的问题。
将爬取的html文宇内容存储在D盘的xynu.txt文档里。
好的,你可以使用Python的文件操作来实现将爬取的HTML内容存储到本地文件中。以下是示例代码:
```python
import requests
url = 'https://www.xynu.edu.cn/'
response = requests.get(url)
if response.status_code == 200:
# 将爬取到的HTML文本内容写入文件
with open('D:/xynu.txt', 'w', encoding='utf-8') as f:
f.write(response.text)
print('爬取成功并已保存到D:/xynu.txt')
else:
print('请求失败')
```
这段代码除了发送GET请求到https://www.xynu.edu.cn/外,还会将响应的HTML文本内容写入到D盘的xynu.txt文件中。你需要确保D盘下的路径存在,否则会抛出文件不存在的错误。
阅读全文