首页xpath爬取当当网图片

xpath爬取当当网图片

时间: 2023-07-08 19:52:22 浏览: 203

以下是使用 Python 和 XPath 爬取当当网图片的示例代码： ```python import requests from lxml import etree # 构造请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 发送请求 url = 'http://book.dangdang.com/' response = requests.get(url, headers=headers) # 解析HTML页面 html = etree.HTML(response.text) # 提取图片链接并下载 img_urls = html.xpath('//img/@src') for img_url in img_urls: response = requests.get(img_url, headers=headers) with open(img_url.split('/')[-1], 'wb') as f: f.write(response.content) ``` 在这个示例中，首先构造了一个请求头，然后使用 requests 库发送请求。接着使用 lxml 库的 etree 模块解析 HTML 页面，并使用 XPath 提取页面中的所有图片链接。最后，遍历图片链接并使用 requests 库下载图片。注意，这个示例只是提取了页面中的所有图片链接，如果你想要爬取某个特定的图片，需要根据图片的 XPath 进行定位。

阅读全文