python爬虫爬取淘宝商品双十一
时间: 2024-03-05 18:45:42 浏览: 79
Python爬虫可以用来爬取淘宝商品信息,包括双十一期间的商品。下面是一个简单的示例代码,用于爬取淘宝商品的名称和价格:
```python
import requests
from bs4 import BeautifulSoup
def get_taobao_products(keyword):
url = f'https://s.taobao.com/search?q={keyword}&sort=sale-desc'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'
}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
products = soup.find_all('div', class_='JIIxO')
result = []
for product in products:
name = product.find('div', class_='row row-2 title').text.strip()
price = product.find('div', class_='price g_price g_price-highlight').text.strip()
result.append({'name': name, 'price': price})
return result
keyword = '双十一'
products = get_taobao_products(keyword)
for product in products:
print(product['name'], product['price'])
```
这段代码使用了requests库发送HTTP请求,使用BeautifulSoup库解析HTML页面。首先构造了一个搜索URL,然后发送GET请求获取页面内容。接着使用BeautifulSoup解析页面,找到商品的名称和价格,并将结果存储在一个列表中。
请注意,这只是一个简单的示例代码,实际爬取淘宝商品可能需要处理更多的页面结构和反爬机制。在实际应用中,还需要考虑到反爬虫策略、数据存储等问题。
阅读全文