python如何下载在线文档
时间: 2024-10-16 08:16:13 浏览: 8
Python下载在线文档通常可以使用requests库配合BeautifulSoup或者lxml等解析库,如果文档是HTML格式,可以通过抓取网页内容并保存到本地。以下是一个简单的步骤示例:
```python
import requests
from bs4 import BeautifulSoup
# 指定要下载的URL
url = "http://example.com/document.html"
# 发送GET请求获取网页内容
response = requests.get(url)
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到需要下载的部分,比如所有的链接或特定元素
download_links = soup.find_all('a', href=True) # 这里假设文档中有下载链接
# 遍历下载链接,构建完整的URL并保存
for link in download_links:
file_url = link['href']
filename = file_url.split("/")[-1] # 获取文件名
with open(filename, 'wb') as f:
response = requests.get(file_url)
f.write(response.content)
阅读全文