我需要一段python爬虫爬取京东的代码
时间: 2023-08-25 20:22:01 浏览: 180
好的,以下是一个简单的Python爬虫用于爬取京东商品信息的代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = "https://search.jd.com/Search?keyword=Python&enc=utf-8&wq=Python&pvid=74c9e6f6d2c14a4aaf3d2c3fb0c2b6b7"
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, "html.parser")
for item in soup.select('li.gl-item'):
p_name = item.select('.p-name em')[0].text.strip()
p_price = item.select('.p-price i')[0].text.strip()
print(p_name, p_price)
```
该代码使用了Python的requests和BeautifulSoup库,首先定义了要爬取的京东商品页面的URL,然后使用requests库发送请求并传入headers,获取页面的HTML代码。接着使用BeautifulSoup库解析HTML代码,通过CSS选择器选取商品名称和价格信息,并打印出来。
当然,还可以对代码进行更多的优化和修改,例如添加异常处理、加入多线程爬取等等。
阅读全文