python爬虫下载网站文件
时间: 2024-01-04 16:03:46 浏览: 279
一个基于Python的简单的用于抓取以及下载页面中pdf文件的爬虫脚本+源代码+文档说明
你可以使用Python编写爬虫来下载网站文件。以下是一个简单的示例代码,用于下载一个特定URL的文件:
```python
import requests
def download_file(url, file_path):
response = requests.get(url)
with open(file_path, 'wb') as file:
file.write(response.content)
print(f"文件已下载至 {file_path}")
# 调用示例
download_file('http://example.com/file.pdf', 'path/to/save/file.pdf')
```
在上述代码中,`url` 参数是要下载的文件的URL,`file_path` 参数是要保存文件的路径和文件名。你可以根据实际需要修改这两个参数。
请注意,这只是一个简单的示例,你可能还需要处理一些异常情况、设置请求头等。另外,在编写爬虫时,请遵守网站的使用规则并尊重隐私权和版权法。
阅读全文