使用python爬取唯品会商品,爬取商品的标题,价格,链接,店铺,将返回值放在一个列表中
时间: 2024-04-07 08:29:47 浏览: 86
好的,我可以为您编写一个爬取唯品会商品信息的 Python 程序。这里需要使用到 requests 和 BeautifulSoup 库,您需要提前安装这两个库,可以通过以下命令进行安装:
```
pip install requests beautifulsoup4
```
接下来,您可以使用以下代码来实现您的需求:
```python
import requests
from bs4 import BeautifulSoup
def get_vip_products(keyword):
# 构造请求 URL
url = f"https://category.vip.com/suggest.php?keyword={keyword}"
# 发送 GET 请求
response = requests.get(url)
# 解析 JSON 数据
data = response.json()
# 提取关键字对应的商品 ID
product_id = data["data"]["products"][0]["id"]
# 构造请求 URL
url = f"https://detail.vip.com/detail-{product_id}-0-1.html"
# 发送 GET 请求
response = requests.get(url)
# 解析 HTML 页面
soup = BeautifulSoup(response.text, "html.parser")
# 提取商品标题
title = soup.find("div", {"class": "goods-info"}).find("h1").text.strip()
# 提取商品价格
price = soup.find("div", {"class": "goods-price"}).find("span", {"class": "price"}).text.strip()
# 提取商品链接
link = url
# 提取店铺名称
seller = soup.find("div", {"class": "goods-info"}).find("div", {"class": "store-info"}).find("span").text.strip()
# 将商品信息添加到列表中
products = [{
"title": title,
"price": price,
"link": link,
"seller": seller,
}]
return products
```
这个函数接受一个关键字作为参数,返回一个包含多个商品信息的列表。您可以通过调用这个函数来实现您的需求,例如:
```python
products = get_vip_products("iphone")
print(products)
```
这将输出一个包含一个 iPhone 商品信息的列表,每个商品信息包含标题、价格、链接和店铺名称。注意,由于唯品会的页面结构与其他电商网站有所不同,这里的实现可能不太通用,您需要根据实际情况进行调整。
阅读全文