爬取京东手机销售量的代码
时间: 2023-07-09 09:55:10 浏览: 95
京东商城商品信息爬取_爬虫_京东_
5星 · 资源好评率100%
以下是使用 Python 爬取京东手机销售量的代码示例:
```python
import requests
from lxml import etree
url = "https://list.jd.com/list.html?cat=9987,653,655&page=1&sort=sort_totalsales15_desc&trans=1&JL=6_0_0#J_main"
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36",
}
response = requests.get(url, headers=headers)
html = etree.HTML(response.text)
phone_names = html.xpath('//div[@class="p-name"]/a/em/text()')
sales_counts = html.xpath('//div[@class="p-commit"]/strong/a/text()')
for i in range(len(phone_names)):
print(f"{phone_names[i]} 的销售量为 {sales_counts[i]}")
```
说明:
- `url`:京东手机分类列表页的地址,其中 `page=1` 表示第一页,`sort=sort_totalsales15_desc` 表示按销售量排序。
- `headers`:请求头信息。
- 使用 `requests.get()` 方法获取页面的 HTML 内容,然后使用 `etree.HTML()` 方法将其转化为可操作的 HTML 对象。
- 使用 XPath 语法从 HTML 中提取出手机名称和销售量信息,然后打印输出。
阅读全文