对web页面元素提取,输出,保存。编写python代码,提取图像URL。用print实现如下输出: 图像列表中,png图像文件为:20180112025424524.png 对应的URL为:http://image.nationalgeographic.com.cn/2018/0112/20180112025424524.png
时间: 2024-02-29 20:56:43 浏览: 64
好的,针对你的问题,可以使用Python中的requests和BeautifulSoup库来完成。代码如下:
```python
import requests
from bs4 import BeautifulSoup
# 发送HTTP请求
url = "http://example.com" # 替换成你想要提取图像URL的网页链接
response = requests.get(url)
# 解析HTML内容
soup = BeautifulSoup(response.content, "html.parser")
img_tags = soup.find_all("img")
# 查找PNG格式的图片
png_imgs = [img for img in img_tags if img["src"].endswith(".png")]
# 输出结果
for img in png_imgs:
print("图像列表中,png图像文件为:{}".format(img["src"].split("/")[-1]))
print("对应的URL为:{}".format(img["src"]))
```
其中,`img_tags = soup.find_all("img")`可以提取HTML中所有的<img>标签,`png_imgs = [img for img in img_tags if img["src"].endswith(".png")]`可以筛选出所有PNG格式的图片。最后用`print`函数输出结果即可。注意将代码中的网页链接替换成你要提取图像URL的网页链接。
阅读全文