python爬取淘宝代码
时间: 2023-09-01 13:09:10 浏览: 111
以下是一个简单的 Python 爬取淘宝的代码示例,仅供参考:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://s.taobao.com/search?q=python'
# 设置请求头,模拟浏览器请求
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 发送 HTTP 请求,获取搜索页面的 HTML 源代码
response = requests.get(url, headers=headers)
# 使用 BeautifulSoup 解析 HTML 源代码,获取商品信息
soup = BeautifulSoup(response.text, 'html.parser')
items = soup.select('.item.J_MouserOnverReq')
for item in items:
# 获取商品标题和价格
title = item.select('.title')[0].text.strip()
price = item.select('.price')[0].text.strip()
# 打印商品信息
print('商品标题:', title)
print('商品价格:', price)
print('-' * 50)
```
注意,上述代码仅是一个示例,实际爬取淘宝需要更加复杂的处理,例如处理反爬虫机制、分页爬取、使用代理IP等。同时,爬取淘宝也需要遵守相关法律法规和淘宝平台的规定,不得进行侵犯他人权益的行为。
阅读全文