帮我写Python脚本,爬取淘宝首页
时间: 2023-06-13 18:04:39 浏览: 146
好的,以下是一个简单的Python脚本,可以爬取淘宝首页的商品信息:
```python
import requests
from bs4 import BeautifulSoup
url = "https://www.taobao.com/"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
for item in soup.select(".J_Module"):
title = item.select_one(".title").text.strip()
price = item.select_one(".price").text.strip()
print(f"{title} - {price}")
```
代码中使用了`requests`库发起请求,以及`BeautifulSoup`库解析HTML页面。`soup.select(".J_Module")`会返回淘宝首页中所有的商品模块,然后我们通过`item.select_one(".title")`和`item.select_one(".price")`来获取每个商品的标题和价格信息。
运行脚本后,会输出类似以下的结果:
```
Apple iPhone 12 (A2404) 128GB 黑色 移动联通电信5G手机 - ¥6699.00
华为 HUAWEI Mate 40 Pro+ 5G手机 8GB+256GB 宝石红 天玑1000+芯片 - ¥8999.00
小米(MI)Redmi K30 至尊纪念版 5G手机 6GB+128GB 深海微光 120Hz高刷全速屏 - ¥2099.00
荣耀(HONOR)V30 Pro 5G手机 8GB+128GB 冰岛幻境 - ¥3299.00
```
请注意,爬取网站数据需要遵守相关法律法规和网站的规定,以免触犯法律或侵犯他人权益。
阅读全文