url=https://www.dpm.org.cn/lights/royal/p/81.html 获取网页的源码,保存到gugong index.html文件中 2、任意5张图抓取到本地,并命名为1.jpg、2.jpg、3.jpg 用python做
时间: 2024-09-13 20:15:51 浏览: 68
要完成这个任务,你可以使用Python中的requests库来获取网页的源码,并使用BeautifulSoup库来解析HTML内容,以便找到图片链接。然后,使用requests库下载这些图片并保存到本地。以下是完成这个任务可能的步骤和代码示例:
1. 首先安装所需的库,如果你还没有安装它们,可以使用pip命令安装:
```
pip install requests
pip install beautifulsoup4
```
2. 使用requests库获取网页源码,并保存到本地文件:
```python
import requests
url = 'https://www.dpm.org.cn/lights/royal/p/81.html'
response = requests.get(url)
if response.status_code == 200:
with open('gugong/index.html', 'wb') as file:
file.write(response.content)
```
3. 解析网页源码,找到图片链接。这里假设图片链接是直接从img标签的src属性获取的,实际情况可能需要根据网页的具体结构进行调整:
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.content, 'html.parser')
img_tags = soup.find_all('img', limit=5) # 假设我们只找前5个图片标签
img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]
```
4. 下载并保存图片:
```python
for i, img_url in enumerate(img_urls):
img_response = requests.get(img_url)
if img_response.status_code == 200:
with open(f'gugong/{i+1}.jpg', 'wb') as file:
file.write(img_response.content)
```
请注意,上述代码只是一个基础的示例,实际使用时可能需要处理一些特殊情况,例如相对路径的图片URL需要转换为绝对路径,以及网络请求失败时的错误处理等。
阅读全文