python 爬取附件文件
时间: 2023-08-19 09:05:17 浏览: 157
python收附件
你可以使用Python的爬虫库来爬取附件文件。以下是一个基本的示例,可以帮助你开始:
```python
import requests
# 定义要下载的文件的URL
file_url = "https://example.com/file.pdf"
# 发起请求并获取文件内容
response = requests.get(file_url)
# 检查响应状态码
if response.status_code == 200:
# 提取文件名
file_name = file_url.split("/")[-1]
# 保存文件到本地
with open(file_name, "wb") as file:
file.write(response.content)
print("文件已保存")
else:
print("文件下载失败")
```
在上面的示例中,我们使用了`requests`库发起HTTP请求,并使用`get`方法获取文件内容。然后,我们检查响应的状态码,如果是200,表示请求成功,我们提取文件名并将文件内容保存到本地。
请注意,这只是一个基本示例,实际应用中可能需要处理更多的情况,例如处理重定向、处理异常等。另外,还要遵守网站的爬虫规则,以免触发反爬虫机制。
阅读全文