写一个爬取京东商品数据的py 代码
时间: 2024-05-01 08:19:44 浏览: 113
python京东商品爬取
好的,以下是一个简单的爬取京东商品数据的 Python 代码:
```python
import requests
from bs4 import BeautifulSoup
# 构造请求头部,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 构造请求参数
url = 'https://search.jd.com/Search'
params = {
'keyword': '手机',
'enc': 'utf-8',
'page': 1
}
# 发送请求
response = requests.get(url, headers=headers, params=params)
response.encoding = 'utf-8'
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
goods_list = soup.select('#J_goodsList > ul > li')
# 遍历商品列表,提取商品信息
for goods in goods_list:
name = goods.select('.p-name')[0].text.strip()
price = goods.select('.p-price')[0].text.strip()
comment_num = goods.select('.p-commit')[0].text.strip()
shop_name = goods.select('.p-shop')[0].text.strip()
print(name, price, comment_num, shop_name)
```
这段代码使用了 requests 库发送 GET 请求,BeautifulSoup 库解析网页内容,通过 CSS 选择器提取商品信息。其中,我以“手机”为例进行了商品搜索,你可以根据需要修改参数,如搜索关键词、页码等。同时,需要注意的是,爬取京东等电商网站的商品信息时,需要遵守相关法律法规,避免涉嫌侵权等行为。
阅读全文