写一个爬虫 爬取贝壳找房网站二手房无锡 小区名从excel里取
时间: 2023-07-10 20:34:01 浏览: 165
贝壳二手房网站二手房信息爬虫
好的,以下是一个简单的 Python 爬虫代码,用于爬取贝壳找房网站二手房信息。其中小区名从 Excel 文件中读取,你需要安装 openpyxl 库来读取 Excel 文件。此外,本代码仅供学习参考,请勿用于商业用途。
```python
import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook
# 读取 Excel 文件
wb = load_workbook("小区列表.xlsx")
ws = wb.active
column = ws['A']
# 遍历小区列表
for cell in column:
if cell.value is not None:
# 构造请求 URL
url = f"https://wuxi.baixing.com/ershoufang/o{cell.value}"
# 发送 GET 请求
response = requests.get(url)
# 解析 HTML
soup = BeautifulSoup(response.text, "html.parser")
# 获取房源信息
houses = soup.find_all("li", class_="ad-item")
for house in houses:
# 输出房源信息
print(house.find("a").text.strip())
```
在代码中,我们首先通过 `load_workbook` 函数读取 Excel 文件,然后遍历第一列中的小区名,依次构造请求 URL 并发送 GET 请求。接着,我们使用 BeautifulSoup 解析 HTML 并获取房源信息,最后将房源信息输出到控制台。你可以根据需求进行修改,例如将房源信息保存到文件中等。
阅读全文