xpath爬取当当网图片
时间: 2023-07-08 19:52:22 浏览: 203
以下是使用 Python 和 XPath 爬取当当网图片的示例代码:
```python
import requests
from lxml import etree
# 构造请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 发送请求
url = 'http://book.dangdang.com/'
response = requests.get(url, headers=headers)
# 解析HTML页面
html = etree.HTML(response.text)
# 提取图片链接并下载
img_urls = html.xpath('//img/@src')
for img_url in img_urls:
response = requests.get(img_url, headers=headers)
with open(img_url.split('/')[-1], 'wb') as f:
f.write(response.content)
```
在这个示例中,首先构造了一个请求头,然后使用 requests 库发送请求。接着使用 lxml 库的 etree 模块解析 HTML 页面,并使用 XPath 提取页面中的所有图片链接。最后,遍历图片链接并使用 requests 库下载图片。注意,这个示例只是提取了页面中的所有图片链接,如果你想要爬取某个特定的图片,需要根据图片的 XPath 进行定位。
阅读全文
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://img-home.csdnimg.cn/images/20250102104920.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![py](https://img-home.csdnimg.cn/images/20250102104920.png)
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)