用python写一段爬取淘宝价格的程序
时间: 2023-12-29 22:04:13 浏览: 111
以下是一段爬取淘宝价格的Python程序:
```python
import requests
from bs4 import BeautifulSoup
def get_price(keyword):
# 通过分析淘宝搜索页面的URL,构造请求URL
url = "https://s.taobao.com/search?q=" + keyword
# 使用requests库发送HTTP GET请求,获取搜索页面内容
response = requests.get(url)
# 使用BeautifulSoup库解析页面HTML代码
soup = BeautifulSoup(response.text, "html.parser")
# 通过CSS Selector获取商品价格
price_tag = soup.select(".price")[0]
# 从价格标签中提取价格,并去除多余的字符
price = price_tag.text.strip().replace("¥", "")
# 返回价格
return float(price)
# 测试程序
keyword = "iPhone 12"
price = get_price(keyword)
print(f"The price of {keyword} on Taobao is: ¥{price:.2f}")
```
说明:
1. 程序使用requests库发送HTTP GET请求,获取淘宝搜索页面的HTML代码。
2. 程序使用BeautifulSoup库解析HTML代码,并通过CSS Selector获取商品价格标签。
3. 程序从价格标签中提取价格,并去除多余的字符。
4. 程序返回提取到的价格。
注意:程序中只获取了第一个商品的价格,如果搜索结果有多个商品,可以通过循环遍历所有商品,获取它们的价格。此外,淘宝反爬虫机制比较严格,如果频繁请求会被封IP,建议使用代理IP或者延长请求间隔时间。
阅读全文